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Vorwort 


Der vorliegende Band versammelt die Beiträge einer interdisziplinären Tagung mit 
dem Titel „KI - Text und Geltung. Wie verändern KI-Textgeneratoren wissen- 
schaftliche Diskurse?“, die am 25. und 26. August 2023 an der Technischen Univer- 
sität Darmstadt stattfand. Die Tagung und dieser Band sind Ergebnisse des Ad hoc- 
Vorhabens Diskurse disruptiver digitaler Technologien am Beispiel von KI-Textge- 
neratoren (April bis Dezember 2023) des hessenweiten Netzwerks Zentrum verant- 
wortungsbewusste Digitalisierung (ZEVEDD. 

Wir danken ZEVEDI, namentlich der wissenschaftlichen Direktorin, Prof. Dr. 
Petra Gehring, der Leiterin der Geschäftsstelle, Dr. Christiane Ackermann, und Dr. 
Klaus Angerer, Wissenschaftliche Projektgruppen-Koordination, für die gleicher- 
maßen wohlwollende und wertschätzende Unterstützung unseres Forschungs- 
projekts. 

Für die perfekte Vorbereitung und reibungslose Durchführung der Tagung (vor 
Ort und im hybriden Format) einerseits und für die Veröffentlichung des Ta- 
gungsbandes andererseits sind wir einem Team zu großem Dank verpflichtet: allen 
voran Kathrin Burghardt, wissenschaftliche Mitarbeiterin im Ad hoc-Vorhaben, für 
ihren unermüdlichen Einsatz und ihr bewundernswertes Engagement, Aneta Ko- 
morek-Riegel M.A. und Christine Armbruster vom Institut für Theologie und Sozi- 
alethik (iths) der Technischen Universität Darmstadt sowie den studentischen 
Hilfskräften Sandra Kunz (Technische Universität Darmstadt), Brian Mügendt 
(Goethe-Universität Frankfurt) und Marvin Trebbien (Goethe-Universität Frank- 
furt) für ihre tatkräftige Unterstützung. 

Besonderer Dank gilt unserem Kollegen Prof. Dr. Hermann-Josef Große Kracht 
vom Institut für Theologie und Sozialethik (iths) der Technischen Universität 
Darmstadt. 

Ebenso danken wir Pfr. i.R. Dr. Günter Meyer-Mintel (Moers) sehr herzlich für 
die — gewiss: eigenhändige — Gestaltung des Umschlags. 

Schließlich danken wir allen Beitragenden, ob vor Ort in Darmstadt oder aus 
dem Call for Papers, für die ebenso konstruktive wie angenehme Zusammenarbeit 
und für ihre Bereitschaft, Forschungsergebnisse zu teilen, unterschiedliche Sicht- 
weisen und Disziplinen miteinander ins Gespräch zu bringen und Perspektiven für 
einen ethisch, politisch und rechtlich angemessenen Umgang mit KI-Textgenerato- 
ren zu diskutieren. Ihr aller Engagement und die Einhaltung des engen Zeitrahmens 
haben das frühzeitige Erscheinen dieses Bandes ermöglicht. 
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VI —- Vorwort 


Dem Verlag De Gruyter, namentlich Dr. Albrecht Döhnert und Dr. Katrin Hudey, 
danken wir für die Aufnahme in das Verlagsprogramm und die wiederum sehr 
kompetente Betreuung. 


Darmstadt/Hamburg und Frankfurt am Main, den 24. Oktober 2023 
Gerhard Schreiber und Lukas Ohly 
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Eine Einleitung 


1 Sprachlos vor Sprachmodellen? 


„Der menschenwürdige Sinn der Computers wäre es, das Denken der Lebendigen so 
sehr zu entlasten, daß es Freiheit gewinnt zu dem nicht schon impliziten Wissen.“ 
Dieser von Theodor W. Adorno vor beinahe 60 Jahren geäußerte Gedanke über den 
Umgang mit „kybernetischen Maschinen“ scheint prophetisch für unsere Zeit zu 
sein. Eine Zeit, die von einer Flut an Entwicklungen im Bereich der Digitaltechno- 
logien überwältigt wird, in der dem Menschen - wohin man auch blickt - zuvor 
ungeahnte, ja bisweilen ungewollte Möglichkeiten vor Augen geführt werden, auf 
Errungenschaften im Bereich der Künstlichen Intelligenz (KI) zurückgreifen zu 
können. Eine Zeit, in der Visionen Realitäten und Realitäten Visionen werden, die 
nichts Geringeres darstellen als eine digitale Revolution der Denkungsart: sich des 
eigenen Verstandes nicht mehr ohne Anleitung künstlicher neuronaler Netze be- 
dienen zu müssen. Ein Gewinn an Freiheit, der sich - fataler Beigeschmack - als 
selbstverschuldeter Verlust an Mündigkeit zu entpuppen droht. 

In diesem Spannungsfeld zwischen dystopischen Schreckensvisionen und 
eutopischen Heilsversprechen bewegt sich auch die Diskussion über KI-Textgene- 
ratoren, ein Thema, das dieser Band aus unterschiedlichsten Disziplinen und Per- 
spektiven beleuchtet. 

Die Aussage, dass KI Texte generieren kann, sagt etwas tiber das Verstandnis 
von Texten aus. Was überhaupt ist ein KI-generierter Text und was konstituiert 
einen Text als solchen? Worin unterscheiden sich menschengeschriebene und 
maschinengenerierte Texte? Welche Erwartungen, Befürchtungen und Hoffnungen 
hegen Wissenschaften, wenn in ihren Diskursen teilweise oder vollständig KI-ge- 
nerierte Texte rezipiert werden und wissenschaftliche Anerkennung finden, deren 
Urheberschaft und Originalität nicht mehr eindeutig definierbar sind? Wie ver- 
ändert sich die Arbeit mit Quellen, und welche Konsequenzen ergeben sich daraus 
für die Kriterien wissenschaftlicher Textarbeit und das Verständnis von Wissen- 


1 Theodor W. Adorno, „Anmerkungen zum philosophischen Denken“ (Vortrag für den Deutsch- 
landfunk vom 9. Oktober 1964), in ders., Stichworte. Kritische Modelle 2, Frankfurt a.M. 1969, 11-19, 
hier 12 (unter Verwendung der heute nicht mehr gebräuchlichen Pluralform „Computers“. 

2 Ebd, 11. 
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schaft insgesamt? Welche Chancen und Risiken bergen KI-Textgeneratoren aus Sicht 
von Technikethik und Technikfolgenabschätzung? Was sind Geltungsansprüche 
(wert) in Zeiten von KI-Textgeneratoren? Und welche Kriterien sind für einen 
ethisch bewussten Umgang mit KI-Textgeneratoren im Bildungskontext anzulegen? 

Diese und ähnliche Fragen verdeutlichen die Komplexität und Tragweite der 
Herausforderung, die der stetig wachsende und zunehmend selbstverständliche 
Einsatz von KI-Textgeneratoren für das zukünftige Arbeiten mit und an Texten mit 
sich bringt. Hierbei kristallisieren sich Problematiken heraus, die sich an ein breites 
Spektrum von Disziplinen wenden - von Philosophie, Theologie, Sprach-, Literatur-, 
Rechts- und Geschichtswissenschaften über Informatik und Technikfolgenabschät- 
zung bis hin zu Medienpädagogik, Erziehungs- und Kommunikationswissenschaf- 
ten sowie Wirtschaftspsychologie. Jede dieser Disziplinen sieht sich durch KI-Text- 
generatoren mit einzigartigen Fragestellungen konfrontiert, und ihre jeweils 
spezifischen Diskurse werden in diesem Band zum Gegenstand der Analyse ge- 
macht. 

Generative Sprachtechnologien sind keine völlig neue Entwicklung. Man denke 
an das bereits 1966 von Joseph Weizenbaum entwickelte Computerprogramm 
ELIZA, das menschenähnliche Kommunikation simulierte.” Dennoch verdeutlicht 
der bemerkenswerte, aber keineswegs unerklärliche Hype um den KI-Chatbot 
ChatGPT, welcher im November 2022 von OpenAl als Beta-Version der Öffentlichkeit 
kostenfrei zur Verfügung gestellt wurde, dass KI schon lange keine ferne Zu- 
kunftsvision mehr darstellt. Sie ist angekommen und hat sich bereits fest in unserer 
heutigen Lebenswelt etabliert. KI-Textgeneratoren werden nicht nur tiefgreifende 
Veränderungen für diverse Berufsgruppen herbeiführen, die mit Texten arbeiten, 
sondern auch in Forschung und Wissenschaft insgesamt eine bedeutende Rolle 
spielen. 

Insofern ist es von höchster Bedeutung, das disruptive Potenzial digitaler 
Technologien am Beispiel von KI-Textgeneratoren kritisch zu reflektieren. Es soll 
verhindert werden, dass Menschen sprachlos vor den Erzeugnissen KI-gestützter 
Sprachmodelle sitzen „wie der Hund vorm Grammophon im Glauben, dass sich sein 
Herrchen im Gerät versteckt“.* Stattdessen soll aus verschiedenen Perspektiven 
untersucht werden, wie trotz der befürchteten und bereits erkennbaren proble- 
matischen Anwendungen von KI-Tools ein ebenso sinnvoller wie verantwortungs- 
bewusster Umgang mit diesen Technologien erreicht werden kann. KI-Textgenera- 


3 Joseph Weizenbaum, „ELIZA - A Computer Program For the Study of Natural Language Com- 
munication Between Man And Machine“, Communications of the ACM, Bd. 9(1), 1966, 36-45. 

4 Miriam Meckel, „Das Papageienproblem von Sprachmodellen“, Handelsblatt, 23.06.2022, in 
[https:/tip.de/er85g] (Zugriff: 12.10.2023). 
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toren könnten dann, um nochmals Adorno aufzugreifen, dazu beitragen, das 
menschliche Denken von routinemäßigen Aufgaben zu entlasten und Freiraum für 
eigenständiges Denken zu schaffen, welches nach Adorno erst dann als philoso- 
phisches betrachtet werden kann, „sobald es sich nicht begnügt mit Erkenntnissen, 
die sich absehen lassen und bei denen nicht mehr herausschaut, als man schon 


hineinsteckte“.° 


2 Re-Evaluierung von Urheberschaft 


Die aktuelle Infragestellung des traditionellen Textverständnisses tritt besonders 
hervor, wenn man ein Beispiel aus dem Bildungs- und Wissenschaftsbereich be- 
trachtet, das in Zeiten des fast uneingeschränkten Zugangs zu sogenannten Large 
Language Models (LLM) immer relevanter wird. Nach den Plagiatsskandalen des 
letzten Jahrzehnts stellt sich nun durch Sprachmodelle die Frage: „Hat die Verfas- 
serin den Text wirklich selbst geschrieben?“ nochmals verschärft. Nun avancieren 
Urheberschaft und Originalität selbst zu Wissenschaftskriterien, die nicht zu allen 
wissenschaftlichen Epochen bedeutsam waren, sich aber nun noch vor die klassi- 
schen Kriterien der Intersubjektivität, Reliabilität und Validität setzen. In manchen 
Zeiten nannten sich die Autoren wissenschaftlicher Texte nicht einmal beim Na- 
men, sondern verwendeten Pseudonyme oder blieben anonym, um sich einem 
Forschungsprogramm zuzuordnen und dessen Methode als erlernbar darzustel- 
len.° Im Gegensatz dazu betonten Renaissance und Aufklärung das Individuum im 
Forschungsprozess. So beeinflusste Immanuel Kants Geniebegriff” unsere Vorstel- 
lung von Wissensgenerierung. Auch geht Charles S. Peirce davon aus, dass nur 
sachkundige Wissenschaftler*innen zur Schlussform der Abduktion fähig sind.’ 
Dementsprechend wurden und werden Preise an herausragende Forscherinnen 
und Forscher für ihre Leistungen verliehen beziehungsweise diese als Lebenswerk 
gepriesen und damit an ihre persönliche Identität geknüpft. 

Welche Bedeutung aber hat die Persönlichkeit einer Wissenschaftlerin in Zei- 
ten von Sprachmodellen? Wird die Zuschreibung wissenschaftlicher Ergebnisse auf 
ihre Urheberin nun zurückgenommen, wenn auch „anonyme“ KI-Systeme in der 
Lage sind, Texte zu verfassen? Oder wird, im Gegensatz dazu, die Urheberschaft zur 


5 Adorno 1969, 11-12. 

6 Roland Barthes, „Der Tod des Autors“, in ders., Das Rauschen der Sprache (Kritische Essays IV), 
übers. von Dieter Hornig, Frankfurt a.M. 2005, 57-63, 57. 

7 Immanuel Kant, Kritik der Urteilskraft, hg. von Wilhelm Weischedel, Bd. 10, Frankfurt a.M. 1974, 
§ 46. 

8 Charles S. Peirce, Vorlesungen tiber Pragmatismus, hg. von Elisabeth Walther, Hamburg 1991, 116. 


4 —— Lukas Ohly/Gerhard Schreiber 


differentia specifica zwischen wissenschaftlichen Publikationen und vollautoma- 

tisch generierten Texten? 

Wenn die Originalität eines Textes zur Frage wird, sind zwei gegenläufige Re- 
aktionen darauf naheliegend: 

1. Entweder erfolgt die Überprüfung der Originalität nun selbst durch einen KI- 
Scanner, der das Muster des betreffenden Textes als computergestützt oder 
menschlich (als originär oder Plagiat) identifiziert. Dieses Kriterium ist heikel, 
weil zum einen hierbei die KI als zirkuläres Überprüfungsverfahren fungiert, 
für welches keine Plausibilitätskontrolle außerhalb der Testmethode besteht. 
Zum anderen kann der KI-Scanner auch „andersherum“ zum Laufen gebracht 
werden, um die Überprüfung auszutricksen, indem künstliche Muster ab- 
sichtlich verschleiert werden. 

2. Oder es ist künftig auf Urheberschaft und Originalität als Wissenschaftskrite- 
rien zu verzichten. Hat man bislang blind vorausgesetzt, dass wissenschaftliche 
Texte von Menschen stammen, die ihre Erkenntnisse (oder die anderer) mit- 
teilen, ohne dass diese Voraussetzung als explizites Kriterium galt, kann man 
nun sogar darauf bestehen, dass die expliziten Wissenschaftskriterien nicht 
tangiert sind, wenn diese Voraussetzung entfällt. Zentrale wissenschaftliche 
Kriterien wie methodische Überprüfbarkeit, Wahrheitsorientierung, Konsis- 
tenz betreffen ja nicht die Generierung des Textes selbst, sondern seinen 
Sachbezug. 


Das Unbehagen, das aufkommt, wenn Maschinen Schreibaufgaben für Menschen 
übernehmen, offenbart ein Verständnis von Wissenschaft. Und dieses Verständnis 
bedarf selbst der Geltungsüberprüfung. Welche Phase eines wissenschaftlichen 
Projekts ist von KI-Textgeneratoren überhaupt betroffen: Hypothesenbildung, Ver- 
suchsanordnung, Ausführung, Begründung, Dokumentation? Wie sind diese Phasen 
betroffen, so etwa, dass wissenschaftliche Texte durch etwas anderes ersetzt wer- 
den? Kann man bestimmen, dass KI-basierte Texte nicht als wissenschaftlich gelten? 

Damit steht der Geltungsanspruch wissenschaftlicher Texte im Brennpunkt. 
Dieser könnte als ihr Unterscheidungsmerkmal herangezogen werden. Die Rück 
bindung eines Textes an seine Autorin ist dabei von Bedeutung, denn nicht der Text 
selbst, sondern die Autorin erhebt einen Geltungsanspruch, und es wird ihr auch 
zugemutet, den Text gegenüber Einwänden zu rechtfertigen. KI-Textgeneratoren 
mögen zwar ihre Texte qua Fortschreibung begründen können, aber sie vertreten 
dabei keinen Geltungsanspruch. Nicht die Wahrheit von Textaussagen hängt an der 
Autorin, sondern ein Geltungsanspruch ist mit ihr verbunden. Wie verändert sich 
unser Textverständnis, wenn damit kein „echter“ Geltungsanspruch vertreten wird 
beziehungsweise nur dann, wenn die tatsächliche Urheberschaft verschleiert wird? 
Besitzt ein KI-basierter Text nur dann einen Geltungsanspruch, wenn eine Person 
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ihn für sich beansprucht? Könnte diese Person die Rezipientin sein, die sich unter 
dem Text etwas vorstellen kann? 

Auf die Urheberschaft kann man sich jedoch nicht mehr unmittelbar beziehen, 
sobald generative KI natürliche Personen mit geklonten Stimmen, künstlich gene- 
rierte Bilder und sogar Videos zum Reden und Handeln bringen kann. Jedes Zeugnis 
von Urheberschaft ist dann verdächtig.’ Was kann das „Recht am eigenen Bild“ 
bedeuten, wenn sein Referenzpunkt unscharf wird und das „Eigene“ nicht mehr 
klar in der Gesellschaft bestimmt werden kann? 


3 Zur Diskurslage des vorliegenden Bandes 


Die Beiträge dieses Bandes stammen nicht von Technikskeptiker*innen, sondern 
werfen einen konkreten Blick auf Chancen und Möglichkeiten von Sprachmodellen. 
Sie verdeutlichen, dass KI-Textgeneratoren nützliche Werkzeuge darstellen können, 
um der Wissenschaft Arbeit zu erleichtern, Routineaufgaben zu reduzieren und Zeit 
zu sparen. Sprachmodelle können Textquellen aus anderen Sprachen zumindest so 
genau übersetzen, dass sich darüber eine initiale Annäherung an Gehalte erreichen 
lässt, die sonst unzugänglich blieben (s. den Beitrag von Weiss). Sie können Texte 
zusammenfassen und dadurch den Forschenden rasch einen Überblick über ein 
Themengebiet ermöglichen (Hiltmann). Sie können als Ideenbörse fungieren, Soft- 
ware schreiben (Kunz) oder Textarbeiten in Standardprozessen übernehmen (Se- 
defoglu/S. Ohly, vgl. Becker und Peiter). Schließlich geben sie Aufschluss über das 
bereits vorhandene Schema wissenschaftlicher Texte (Meier-Vieracker, L. Ohly). 
Solchen Arbeitserleichterungen steht gegenüber, dass Zeitersparnisse zulasten 
der Wahrheitsüberprüfung erzielt werden (Weßels), zumal sich die reine Text- 
menge zu einem bestimmten Themengebiet vervielfachen dürfte, weil Texte fortan 
auf Knopfdruck erstellt werden können. Wie lässt sich die Genauigkeit von Texten 
sicherstellen, wenn die Gefahr von Fake-Quellenangaben in den KI-Texten hoch ist? 
Der Ansatz, KI-Modelle mit zusätzlichen KI-Tools zu überprüfen und damit 
„handlicher“ zu machen, stellt bloß eine Verschiebung des Überprüfungsproblems 
dar und führt zu einer Zirkularität des Verfahrens - vor allem, wenn man GPT 
durch GPT überprüfen lässt (Albrecht). Dies wirft Fragen nach der Zuverlässigkeit 
der Outputs auf, gerade wenn Technikfolgenabschätzung und Textüberprüfungen 
ebenfalls von KI-Systemen ausgeführt werden (Weiss), ohne dass die Eindimen- 
sionalität des Trainings von LLMs hinterfragt wird (Kunz). Können diese reflexiven 
Kontrollen der KI durch KI tatsächlich zur Verlässlichkeit ihrer Ergebnisse beitra- 


9 Niklas Luhmann, Soziale Systeme. Grundrifs einer allgemeinen Theorie, Frankfurt a. M. 1987, 208. 
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gen? Erhält der „stochastische Papagei“'° durch diese Selbstspiegelung ein Gesicht, 
das einer persönlichen Identität gleicht? 

Eine solche Zirkularität des KI-Bedarfs durch KI-Gebrauch macht generative KI 
gleichwohl unverzichtbar. Hinzu kommt, dass sich die Programme wissenschaftli- 
chen Überprüfungen entziehen, da ihre Ergebnisse weder erklärbar noch repro- 
duzierbar sind (Arnold). Sie werden somit beides: unverzichtbar und schwer kon- 
trollierbar. Umso mehr stellt sich die Machtfrage dieser Tools (Gehring). 

Vor diesem Hintergrund gewinnt ein weiterer Diskursstrang dieses Bandes an 
Relevanz, der die Stellung des Menschen thematisiert. Gibt es Aspekte, die der 
Mensch nicht den Maschinen übertragen kann (Peiter)? Lassen sich Kriterien für 
die Authentizität der Autorin festlegen (Stöcker)? Ist es möglich, Kreativität, Text- 
qualität und „Seele“ (Becker) zu operationalisieren? Dienen „Schöpfungshöhe“ 
(Bahr) oder „das Menschliche“ (Klinge) als signifikante Kriterien, um originären 
Textgehalt von maschinell generierten „Halluzinationen“ (Stiemer) zu unterschei- 
den? Solche Fragen verdeutlichen ein wachsendes Bedürfnis nach einer Wieder- 
auferstehung des Autors nach dem „Tod des Autors“ (Becker, Doeben-Henisch, 
Geiß, Peiter). Die Suche zielt darauf ab, ein wirksames Widerlager gegen die an- 
onyme Macht des unentbehrlichen GPT-Tools zu finden. 

Damit die Diskussion über das Nicht-Übertragbare des Menschlichen nicht zu 
einer naiven Selbstberuhigung führt, die gerade dadurch das Machtförmige der sich 
selbst erzwingenden generativen Klübersieht, muss das Machtvolle, das „Potenzial“ 
von Texten selbst in den Blick genommen werden. Texte können durch ihren Gehalt, 
Stil, Werdeprozess und Widerfahrenscharakter (Burghardt) imponieren, ebenso 
wie durch ihre soziale Reichweite. In Zeiten, in denen Fakten gegen Fake News 
verteidigt werden müssen — besonders in Anbetracht der massiven Zunahme von 
KI-generierter Desinformation und der wachsenden Schwierigkeit, Authentizität zu 
erkennen (Stöcker) -, liegt im Insistieren auf Fakten ein normativer Zug, der nicht 
zirkulär durch weitere Fakten begründet werden kann. Die Macht von Fakten liegt 
dann in der Macht ihrer sozialen Geltung, nicht ihrer faktischen, sondern einer 
Geltung, die sie verdienen. Hier konkurrieren dann die Macht der maschinellen 
Textgenerierung mit der Macht der Textgeltung. 


10 Vgl. Emily M. Bender et al., „On the Dangers of Stochastic Parrots: Can Language Models Be Too 
Big?“, in FAccT ’21. Proceedings of the 2021 ACM Conference on Fairness, Accountability and 
Transparency, New York 2021, 610-623. 

11 Michel Foucault, Schriften 1, hg. von Daniel Defert und Francois Ewald unter Mitarbeit von 
Jacques Lagrange, Frankfurt a.M. 2001, 1009. 
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4 Zur Gestaltung des Bandes 


Die rasante Entwicklung und Integration von KI-Textgeneratoren in die Wissen- 
schaft wirft viele Fragen auf. Und obwohl jede Wissenschaftsdisziplin ihre eigenen, 
speziellen Erkundungen dazu vornimmt, zeigt sich eine beeindruckende interdis- 
ziplinäre Komplementarität. Die Forschung auf diesem Gebiet hat bereits erhebli- 
che Fortschritte erzielt, was die in diesem Band dokumentierten Ergebnisse auch 
für andere Disziplinen anknüpfungsfähig und auf andere Bereiche übertragbar 
macht. Die Tagung „KI, Text und Geltung“ an der Technischen Universität Darmstadt 
am 25. und 26. August 2023 unterstreicht diese Dynamik: Eine engagierte Wissen- 
schaftsgemeinde kam zusammen, tauschte sich intensiv aus und erkannte ge- 
meinsame Interessen, Herausforderungen und Möglichkeiten, die diese Technolo- 
gie für alle Forschungsfelder mit sich bringt. Die komplementären Darstellungen im 
vorliegenden Band reflektieren dieses gemeinsame Bestreben, bei allen Debatten 
über Potenzial und Grenzen generativer KI die aktuelle technologische Entwicklung 
als gemeinsame Herausforderung für alle Wissenschaftsbereiche anzunehmen. 

Entsprechend sind die Beiträge dieses Bandes’? nicht streng nach Disziplinen, 
sondern nach ähnlichen Fragestellungen aus unterschiedlichen Fachgebieten or- 
ganisiert. Fragt man nach den Auswirkungen von Sprachmodellen auf die Wis- 
senschaft, liegt es nahe, zunächst Forschung und Lehre in den Blick zu nehmen, 
hatten sich doch gerade hier öffentliche Diskussionen über die Zukunft der wis- 
senschaftlichen Hausarbeit oder Promotion entzündet. Darüber hinaus stellt sich 
die Frage der Nachvollziehbarkeit wissenschaftlicher Hypothesenbildung und 
Schlussformen, wenn sie von der Black Box einer „halluzinierenden“ generativen KI 
vorgenommen werden. Die Autor*innen entwickeln in dieser ersten Sektion sowohl 
grundsätzliche Bedenken gegen den Einsatz von KI-Textgeneratoren in der For- 
schung als auch kreative Angebote, um Studierende und Wissenschaftler*innen KI- 
sicherer zu machen. 

Die zweite Sektion taucht in den künstlerischen Aspekt der Text- und Symbol- 
gestaltung ein, der traditionell Künstler*innen wie Dichter*innen, Maler*innen 
oder Fotograf*innen zugeschrieben wird. Lässt sich „Schöpfungshöhe“ operatio- 
nalisieren, dann kann sie theoretisch auch reproduziert und von Maschinen 
übernommen werden. Ist sie dagegen nicht reproduzierbar, wie kann dann das 
ästhetische Urteil „jedermanns Beistimmung“® wert sein, oder welche gesell- 


12 Hinsicht der Verwendung geschlechtergerechter Sprache reflektieren die einzelnen Beiträge 
verschiedene Ansätze zur sprachlichen Repräsentation aller Geschlechter. 

13 Immanuel Kant, Kritik der Urteilskraft, hg. von Wilhelm Weischedel, Bd. X, Frankfurt a.M. 1974, 
101. 
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schaftliche Signifikanz kann dem Kunstwerk beigemessen werden? Ist es für den 
Durchschnittsbetrachter erkennbar, dass einem durch generative KI geschaffenen 
Werk das entscheidende Etwas fehlt? Die Beiträge in dieser Sektion zeigen ambi- 
valente Ansichten: Zum einen wird gezeigt, dass Fachpersonen den Unterschied 
zwischen menschen- und maschinengenerierten Werken erkennen können, dass 
aber zum anderen der Wert dieser Unterscheidung für die Allgemeinheit verlo- 
rengehen dürfte. 

Das in der Kunst so zentrale Thema der Originalität wird in der dritten Sektion 
mit einer tiefen anthropologischen Dimension betrachtet. Die Beiträge legen nahe, 
dass die in Frage stehende Sonderstellung des Menschen mit göttlichen Attributen 
versehen wird oder dass religiöse Begriffe und Metaphern zur Beleuchtung her- 
angezogen werden. Zugleich adoptieren auch Technikdiskurse theologische Se- 
mantiken, um die Differenz von Mensch und Maschine zu relativieren oder sogar 
eine wundersame Sonderstellung der KI zu entdecken. Das Kampffeld „Originalität“ 
von Text, Bild und Ton erreicht fast theologische Dimensionen. 

Die vierte Sektion spitzt den Unterschied von Mensch und Maschine auf das 
Phänomen zu, das Texte überhaupt erst zu Texten macht: das Verstehen. Wie 
können KI-Textgeneratoren dazu beitragen, das Textverständnis zu verbessern? 
Und wie lassen sich Texte hermeneutisch einfangen, hinter denen kein Mensch als 
Autor steht? Dass mit der Zugänglichkeit generativer KI ethische Probleme ver- 
bunden sind, wurde der Öffentlichkeit schnell bewusst. Neben möglichen Be- 
trugsversuchen in Prüfungssituationen besteht die Gefahr, dass die öffentliche 
Aufmerksamkeit mit Fake News überschwemmt wird, ebenso wie Interessen- 
gruppen Diskurse beherrschen und eine Ausgewogenheit verhindern. Weiterhin 
gibt es Bedenken hinsichtlich der Regulierung dieser Technologie, insbesondere 
wenn das primäre Regulierungsinstrument - das Recht - selbst unter die Kontrolle 
des Tools gerät. Das breite Spektrum solcher und genuin ethischer Fragestellungen 
wird in der fünften Sektion beleuchtet. 

Während die vierte Sektion das Verstehen ins Zentrum rückt, das Texte zu 
Texten macht, reflektiert die sechste Sektion die Folgen generativer KI für das 
Medium der Texte: die Sprache. Hierbei wird betont, dass Texte nicht nur der 
Kommunikation dienen, sondern auch Geltungsansprüche stellen. Doch was ge- 
schieht, wenn eine KI Texte produziert, ohne damit Geltungsansprüche zu erheben? 
Auch wenn diese Frage in allen Sektionen mitverhandelt wird, beschäftigen sich 
einige Beiträge speziell mit dem Geltungs- und Wahrheitsbezug der künstlich in- 
telligenten Sprachverwendung. Dabei werden sowohl Auswirkungen auf spezielle 
gesellschaftliche Kontexte in den Blick genommen als auch epistemologische und 
wahrheitstheoretische Grundlagen entwickelt. 

Die Beiträge in der abschließenden siebten Sektion dieses Bandes richten den 
Blick auf bestimmte Anwendungsfelder und Einflüsse generativer KI. Auch hier 
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werden konkrete Analysebeispiele aus dem Unterrichtsbereich und Industriean- 
wendungen vorgestellt sowie theoretische Grundsteine für die Analysebildung 
spezifischer Kontexte gelegt. 

Abschließend ein Wort zum Bandtitel KI:Text. Text, im linguistischen Sinne als 
schriftliche Form kommunikativen Handelns verstanden, trifft auf KI, die Texte in 
natürlichsprachlicher Form erzeugen kann, indem sie die Wahrscheinlichkeits- 
verteilung von Wortfolgen aus Textdatensätzen lernt. Dieses Aufeinandertreffen 
von Ungleichartigem wird durch den Doppelpunkt im Wortinneren symbolisiert. 
Im Unterschied zu einem einfachen Bindestrich, der ein Verbinden ohne Ver- 
schmelzen („KI-Text“) darstellt, signalisiert der Doppelpunkt ein Verschmelzen 
durch Verbinden zu etwas Neuem und deutet auf Verfremdung und Verschmelzung 
zugleich hin. Verfremdung, weil die natürliche Sprache in Interaktion mit künstli- 
cher Intelligenz nicht mehr dieselbe sein wird. Verschmelzung, weil die Grenzen 
zwischen natürlichem und generiertem Text so verschwimmen, sodass sie zuweilen 
ununterscheidbar werden. Der Doppelpunkt repräsentiert eben diese Beziehung, in 
der KI und Text nicht nur nebeneinander, sondern im Verhältnis zueinander stehen. 
KI:Text fordert uns auf, unsere traditionellen Vorstellungen von Sprache, Text und 
Kommunikation zu überdenken. Als ein erster Schritt in dieser Hinsicht dienen die 
Beiträge dieses Bandes. 


I Forschung und Lehre 


Steffen Albrecht 
ChatGPT als doppelte Herausforderung für 
die Wissenschaft 


Eine Reflexion aus der Perspektive der Technikfolgenabschätzung 


Abstract: The public release of ChatGPT in November 2022 has shaken up the 
academic world. Many see Al-based text generators as a potential threat to the in- 
tegrity and competences of scientists, but there is also a huge potential to improve 
research not only in the quantitative sciences, but also in the arts and in qualitative 
social sciences. This contribution presents the results of an investigation into the 
opportunities and limitations of ChatGPT, and its implications for different areas of 
society, from a technology assessment perspective. Furthermore, it discusses the 
challenges of using systems like ChatGPT in scientific policy advice and other aca- 
demic fields. 


1 Einleitung 


Als ChatGPT im November 2022 veröffentlicht wurde, waren Wissenschaftler*innen 
nicht nur unter den ersten, die davon Notiz nahmen, auch die Auswirkungen und 
das disruptive Potenzial dieses so gänzlich neuen KI-basierten Chatbots wurden in 
der Wissenschaft besonders früh spürbar. Studierende nutzten das System, um 
Unterstützung bei der Abfassung ihrer Hausarbeiten zu bekommen oder diese 
gleich in Gänze schreiben zu lassen,’ Forschende überließen dem Chatbot die Au- 
torschaft über Abschnitte ihrer Publikationen? und es zeigte sich, dass ChatGPT 
verschiedene standardisierte Prüfungen an Hochschulen mit respektablen Ergeb- 
nissen absolvieren kann.’ 


1 Stephen Marche, „The College Essay Is Dead“, The Atlantic, 2022, in [theatlantic.com/technology/ 
archive/2022/12/chatgpt-ai-writing-college-student-essays/672371/] (Zugriff: 15.10.2023). 

2 Debby R. E. Cotton/Peter A. Cotton/J. Reuben Shipway, „Chatting and cheating: Ensuring academic 
integrity in the era of ChatGPT“, Innovations in Education and Teaching International, 2023 (DOI: 
10.1080/14703297.2023.2190148). 

3 Jonathan H. Choi et al., „ChatGPT Goes to Law School“, Minnesota Legal Studies Research Paper, 
Bd. 23(3), 2023 (DOI: 10.2139/ssrn.4335905); Tiffany H. Kung et al., „Performance of ChatGPT on 
USMLE. Potential for Al-Assisted Medical Education Using Large Language Models“, PLOS Digital 
Health, 2023 (DOI: 10.1371/journal.pdig.0000198). 


8 Open Access. © 2024 bei den Autorinnen und Autoren, publiziert von De Gruyter. Dieses Werk ist 
lizenziert unter einer Creative Commons Namensnennung - Nicht kommerziell - Keine Bearbeitung 4.0 International 
Lizenz. https:/doi.org/10.1515/9783111351490-003 
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ChatGPT bildet, wie auch andere sogenannte „foundation models“, die 
Grundlage für eine Reihe von Anwendungen, die auf den Leistungen der KI-Text- 
generatoren aufbauen, wie etwa Übersetzungsdienste, Programme zur Lernunter- 
stützung oder für die wissenschaftliche Recherche. Die Modelle sind aber auch in 
dem Sinne grundlegend, dass sie Auswirkungen auf die menschliche Kommunika- 
tion und damit die Grundlage des gesellschaftlichen Zusammenlebens haben. Schon 
bald begann daher in Wissenschaft und Öffentlichkeit eine Debatte darüber, welche 
Folgen KI-Textgeneratoren direkt oder indirekt und auch in längerfristiger Per- 
spektive haben werden. 

Mit diesen Fragen ist auch die Technikfolgenabschätzung (TA) auf den Plan 
gerufen, die Potenziale und mögliche Risiken neuer wissenschaftlicher und tech- 
nologischer Entwicklungen mit wissenschaftlichen Methoden untersucht. Wie viele 
wissenschaftliche Disziplinen, die sich mit KI-Textgeneratoren beschäftigen, ist TA 
in doppelter Weise durch die Entwicklungen herausgefordert. Zum einen bietet sich 
ihr ein neuer Untersuchungsgegenstand, eine Technologie mit potenziell weitrei- 
chenden gesellschaftlichen Folgen. Zum anderen wirkt sich diese Technologie aber 
auch auf die wissenschaftliche Arbeit der TA und die Rahmenbedingungen von TA 
aus. Dieser doppelten Herausforderung geht der vorliegende Beitrag nach. 

Einleitend soll zunächst die besondere Perspektive der TA vorgestellt werden. 
TA bildet zwar keine eigenständige Disziplin im engeren Sinn, ist aber als reflexive 
wissenschaftliche Praxis etabliert und in Deutschland wie auch in vielen anderen 
Ländern institutionalisiert. Es gibt mehrere Einrichtungen, die sich schwerpunkt- 
mäßig mit TA beschäftigen, darunter sowohl Hochschulinstitute als auch Abtei- 
lungen in Unternehmen und Beratungseinrichtungen, etwa bei Parlamenten (wie 
das Büro für Technikfolgen-Abschätzung beim Deutschen Bundestag [TAB]). Auß- 
erdem besteht ein Kanon von Methoden und theoretischen Grundlagen, der nicht 
zuletzt in spezialisierten Vereinigungen, Tagungen und Zeitschriften diskutiert und 
weiterentwickelt wird.* 

Als reflexiv kann TA insofern gelten, als sie neue wissenschaftliche und/oder 
technologische Entwicklungen zum Gegenstand hat und deren Auswirkungen auf 
die Gesellschaft wissenschaftlich untersucht — welchen Nutzen sie versprechen, 
welche Risiken möglicherweise mit ihnen verbunden sind, und wie sich die weitere 
Entwicklung beeinflussen lässt. TA hat dabei den Anspruch, möglichst unvorein- 
genommen auf sowohl Chancen wie auch Risiken zu schauen und durch die 
Überparteilichkeit des „ehrlichen Maklers“ auch ein Gegengewicht zu Hype, 
übertriebenen Erwartungen und einseitiger Vereinnahmung zu bilden. 


4 Armin Grunwald, Technikfolgenabschätzung, Baden-Baden 32022, 70 ff. 
5 Roger A. Pielke, The Honest Broker. Making Sense of Science in Policy and Politics, Cambridge 2007. 
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Ein wichtiges Merkmal der TA ist die interdisziplinäre Perspektive. Die Tech- 
nologien werden nicht nur aus einer technischen, sondern auch zum Beispiel aus 
gesellschafts- oder umweltwissenschaftlicher Perspektive betrachtet, um ein mög- 
lichst umfassendes Bild zu gewinnen - ähnlich der in diesem Tagungsband ver- 
tretenen Vielfalt in Bezug auf KI-Textgeneratoren. Neben der Berücksichtigung 
wissenschaftlicher Disziplinen werden auch Positionen von Betroffenen und 
Stakeholdern außerhalb der Wissenschaft berücksichtigt, da es bei Fragen zu 
Auswirkungen von Technologien auch um solche der Akzeptanz und der prakti- 
schen Nutzung im Alltag geht. In diesem Sinne ist die TA auch transdisziplinär — es 
geht häufig, insbesondere in der sogenannten konstruktiven TA, darum, gemeinsam 
mit Akteuren der Praxis eine neue Technologie bzw. die Rahmenbedingungen ihrer 
Entwicklung und Anwendung zu gestalten. 

Da die allermeisten Quellen in TA-Untersuchungen wissenschaftliche Texte 
sind, wirken sich KI-Textgeneratoren zumindest potenziell sehr weitreichend auf 
die TA aus. Während es im Oktober 2022 noch absurd geklungen haben mag, einen 
Chatbot für wissenschaftliche Studien zu nutzen (außer als Gegenstand derselben), 
gibt die Wissenschaftszeitschrift Nature nur ein Jahr später bereits Tipps, welcher 
Chatbot sich am besten für welche Art von Forschungsaufgabe eignet.® Die Ar- 
beitsschritte bei TA-Untersuchungen bestehen insbesondere in der Erfassung, Be- 
wertung und zielgruppenorientierten Umformulierung von meist in Textform 
vorliegenden Erkenntnissen und liegen damit im Funktionsbereich der KI-Textge- 
neratoren. Daher sollen in diesem Beitrag neben den gesellschaftlichen Auswir- 
kungen von KI-Textgeneratoren (Abschnitt 2) auch ihr Einfluss auf die Arbeit und 
die Rahmenbedingungen von entsprechenden Studien reflektiert werden (Ab- 
schnitt 3), um besser zu verstehen, welche Auswirkungen sich für wissenschaftliche 
Diskurse und die wissenschaftliche (Text-)Arbeit aus einer zunehmenden Nutzung 
von KI-Textgeneratoren ergeben. 


2 KI-Textgeneratoren als Gegenstand der 
Technikfolgenabschatzung 


Als Gegenstand von TA lassen sich KI-Technologien wie die ChatGPT zugrunde lie- 
genden Textgeneratoren (auch als Large Language Models bezeichnet) mit dem 
bewährten Instrumentarium der TA analysieren. Dabei werden anhand der tech- 
nischen Grundlagen und möglicher Anwendungsszenarien der Technologie poten- 


6 Elizabeth M. Humphries et al., „What’s the best chatbot for me? Researchers put LLMs through 
their paces“, Nature Careers, 2023, in [nature.com/articles/d41586-023-03023-4] (Zugriff: 15.10.2023). 
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zielle Implikationen untersucht, meist spielen dabei ethische, rechtliche und soziale 
Aspekte eine Rolle, außerdem der Blick auf ökologische Auswirkungen. Mit einer 
solchen Untersuchung zu ChatGPT wurde das TAB zu Beginn des Jahres 2023 vom 
Deutschen Bundestag beauftragt. Der Fokus der Untersuchung lag zu diesem frühen 
Zeitpunkt weniger auf der Identifizierung von Handlungsoptionen als vielmehr 
darauf, eine Übersicht der verfügbaren Erkenntnisse aus möglichst unterschiedli- 
chen Perspektiven zu schaffen. Mit der Veröffentlichung eines Hintergrundpa- 
piers,’ dessen Ergebnisse im Folgenden zusammengefasst werden, und der Ver- 
anstaltung eines öffentlichen Fachgesprächs leistete der Ausschuss für Bildung, 
Forschung und Technikfolgenabschätzung des Deutschen Bundestages auch einen 
Beitrag zur Weiterentwicklung der öffentlichen Debatte über ChatGPT. 


2.1 Technologische Grundlagen 


In technischer Hinsicht stellt ChatGPT® einerseits eine Fortsetzung der Entwicklung 
bei sprachverarbeitenden KI-Systemen dar, andererseits auch einen technologi- 
schen Sprung, von dem selbst Expert*innen überrascht waren. Die Architektur von 
ChatGPT geht auf das sogenannten Transformermodell zurück, das bereits 2017 von 
einem Forschungsteam von Google vorgestellt wurde. Transformer zeichnen sich 
dadurch aus, dass sie Texte nicht allein sequenziell abarbeiten, sondern auch Ver- 
bindungen zwischen weit entfernt stehenden Wörtern erkennen und dadurch 
sprachliche Kontexte berücksichtigen können. Zudem können für das Training 
parallel arbeitende Grafikprozessoren eingesetzt werden, so dass sehr große Mo- 
delle mit einer Vielzahl von Parametern und einer Unmenge von Trainingsdaten 
technisch möglich werden - im Fall von GPT 3.5 175 Mrd. Parameter und 300 Mrd. 
Textbestandteile Trainingsmaterial. 

Als vierter Aspekt neben der Architektur, den umfangreichen Hardwareres- 
sourcen und den Datenmengen ist bei ChatGPT das Feintuning des Systems auf 
Konversationsfähigkeit hin zu beachten, es gilt als „Erfolgsrezept“ für die große 
Verbreitung des Systems.’ Nach einem ersten, weitgehend automatisierten Training 


7 Steffen Albrecht, ChatGPT und andere Computermodelle zur Sprachverarbeitung — Grundlagen, 
Anwendungspotenziale und mögliche Auswirkungen. Hintergrundpapier Nr. 26, Berlin 2023. 

8 Hier beziehe ich mich auf die zunächst veröffentlichte GPT-Version 3.5, die - im Unterschied zur 
kostenpflichtigen Variante — weiterhin ohne größere Zugangsbeschränkungen nutzbar ist, aller- 
dings ebenfalls weiterentwickelt wurde. 

9 Will D. Heaven, „The inside story of how ChatGPT was built from the people who made it“, MIT 
Technology Review, 2023, in [technologyreview.com/2023/03/03/1069311/inside-story-oral-history-how- 
chatgpt-built-openai/] (Zugriff: 15.10.2023). Bei keinem Onlinedienst war bisher ein vergleichbares 


ChatGPT als doppelte Herausforderung für die Wissenschaft — 17 


mit großen Mengen von Texten aller möglichen Sprachen und Genres wurde das 
Modell weiter justiert, um möglichst generisch und flexibel auf ganz unterschied- 
liche sprachliche Eingaben (die sogenannten Prompts) reagieren zu können. Dazu 
wurden die Antworten des Systems mithilfe von menschlichem Feedback” so an- 
gepasst, dass unerwünschte, etwa rassistische, sexistische oder illegale Aktivitäten 
befördernde Äußerungen unterdrückt und möglichst passende Reaktionen auf die 
Prompts generiert werden. 


2.2 Möglichkeiten... 


So beeindruckend die Leistung von ChatGPT und vergleichbaren Systemen auch ist, 
sie stellen nur eine Form von KI-Systemen dar, neben anderen auf Deep Learning 
oder auch symbolischer künstlicher Intelligenz beruhenden Systemen, die alle 
konstruktionsbedingte Möglichkeiten und Grenzen haben. Hinsichtlich ihrer Mög- 
lichkeiten zeichnen sich KI-Textgeneratoren durch die Breite ihrer Fähigkeiten aus. 
KI-Textgeneratoren stellen „powerful generalist models“ für ganz unterschiedliche 
sprachliche Aufgaben dar.’* Dies umfasst die Erzeugung von Texten mit beachtli- 
cher Länge” zu einem bestimmten Thema in ganz unterschiedlichen Sprachen, 


Wachstum beobachtet worden: Innerhalb von fünf Tagen nach der Veröffentlichung am 30. No- 
vember 2022 meldeten sich 1 Mio. Nutzende an, am 2. Februar 2023 wurden 100 Mio. aktive Nut- 
zende/Monat gemeldet, vergleiche dazu: [wwwtagesschau.de/wirtschaft/digitales/chatgpt-wachs 
tum-bezahlangebot-abo-101.html] (Zugriff: 15.10.2023). Bei TikTok beispielsweise wurde die Schwelle 
von 100 Mio. aktiven Nutzenden nach etwa neun Monaten erreicht, bei Instagram nach zweieinhalb 
Jahren (Oliver Bünte (dpa), „ChatGPT: Rekord-Wachstum und Abo-Modell in den USA“, heise online, 
2023, in [heise.de/news/ChatGPT-startet-Abo-Modell-in-den-USA-7480052.html] (Zugriff: 15.10.2023). 
Mittlerweile scheint allerdings eine Sättigung erreicht, zumindest die Nutzung von ChatGPT über 
das Webinterface ging laut Zahlen der Analysefirma Similarweb im Sommer 2023 zurück, vgl. David 
F. Carr, „ChatGPT Drops About 10% in Traffic as the Novelty Wears Off“, similarweb Blog, in [wwwsi 
milarweb.com/blog/insights/ai-news/chatgpt-traffic-drops/] (Zugriff: 15.10.2023). 

10 Offenbar erfolgte diese Arbeit in Niedriglohnländern unter prekären Arbeitsbedingungen, vgl. 
hierzu Reed Albergotti/Louise Matsakis, „OpenAl has hired an army of contractors to make basic 
coding obsolete“, Semafor, 2023, in [wwwsemafor.com/article/01/27/2023/openai-has-hired-an-army- 
of-contractors-to-make-basic-coding-obsolete] (Zugriff: 15.10.2023); Billy Perrigo, „Exclusive: OpenAl 
Used Kenyan Workers on Less Than $2 Per Hour to Make ChatGPT Less Toxic“, TIME, 2023, in [https:// 
time.com/6247678/openai-chatgpt-kenya-workers] (Zugriff: 15.10.2023). 

11 Chengwei Qin et al., Is ChatGPT a General-Purpose Natural Language Processing Task Solver?, 
arXiv, 2023, 11. 

12 Aktuelle KI-Textgeneratoren sind in der Lage bis zu 75.000 Wörter Text als Eingabe zu verar- 
beiten und mehrere Tausend Wörter Text auszugeben, in [heise.de/news/Claude-2-ist-da-Anthropic- 
veroeffentlicht-neue-Version-des-Chatbots-und-der-API-9214163.html] (Zugriff: 15.10.2023). 
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Stilen und Niveaus, ebenso die Übersetzung zwischen diesen und andere Formen 
der Bearbeitung wie die Analyse, Zusammenfassung oder Korrektur gegebener 
Texte. Durch die Transformer-Architektur können die Systeme den Kontext von 
Ausdrücken berücksichtigen und sie beispielsweise einem übergeordneten Thema 
zuzuordnen. Die Fähigkeit, Texte über unterschiedliche Sprachen hinweg zu ver- 
arbeiten, erstreckt sich auch auf andere regelhaft verwendete Codes wie Pro- 
grammiersprachen - die Erzeugung von Programmcode hat sich als eine der viel- 
versprechendsten Anwendungsmöglichkeiten von KI-Textgeneratoren 
herausgestellt. Neuere Versionen sind in der Lage, auch mit gesprochener Sprache 
und multimodal zu arbeiten, d.h. Inhalte in Text- oder aber Bildform zu verarbeiten 
bzw. auszugeben. 


2.3 ...und Grenzen 


Trotz ihrer generativen Fähigkeiten sind KI-Textgeneratoren, wie andere KI-Syste- 
me, durch ihr Training auf bestimmte Aufgaben ausgerichtet, in diesem Fall die 
Verarbeitung sprachlicher Texte im Rahmen des Materials, mit dem sie trainiert 
(und feinjustiert) wurden. Auch wenn sie Konversationsfähigkeit simulieren kön- 
nen, haben sie kein Verständnis der verarbeiteten Texte," keinen Bezug zu der 
Welt, um die es in den Texten geht, und Schwierigkeiten mit Abstraktion und lo- 
gischen Problemstellungen. Es handelt sich um Sprachmodelle, keine Wissensmo- 
delle.’* Sie antworten in der Regel auch dann, wenn sie zu einer Frage oder Auf- 
forderung keine passende Antwort haben, und produzieren überzeugend 
formulierte, aber frei erfundene Inhalte ohne verlässlichen Bezug zur Realität. Dies 
schließt auch Quellenangaben in wissenschaftlichen Texten ein, die sich bei einer 
kritischen Überprüfung mitunter als fiktiv herausstellen. Reproduzierbarkeit, wie 
sie für wissenschaftliche Zwecke erwartet wird, ist bei KI-Textgeneratoren nicht 
gegeben, sie können auf ein und denselben Prompt unterschiedliche Antworten 
liefern. Bei längeren Konversationen tendieren die Modelle dazu, den Fokus zu 


13 Emily M. Bender/Alexander Koller, „Climbing towards NLU: On Meaning, Form, and Under- 
standing in the Age of Data“, Association for Computational Linguistics, Proceedings of the 58th 
Annual Meeting of the Association for Computational Linguistics, July, 2020, 5185-5198; Celeste Bi- 
ever, „The easy intelligence tests that AI chatbots fail“, Nature, Bd. 619(7971), 2023, 686-689. 

14 Reinhard Heil, „Einige ethische Implikationen großer Sprachmodelle“, KIT Scientific Working 
Papers 221, 2023, 1-2 (DOI: 10.5445/IR/1000158914). 
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verlieren und immer stärker vom erwünschten Kommunikationsverhalten abzu- 
weichen.“ 

Eine Abhängigkeit vom Training bzw. den dabei verwendeten Daten zeigt sich 
auch darin, dass die Systeme solche Sprachen besonders gut beherrschen, die be- 
sonders häufig im Trainingsmaterial vorkamen. Auch die Inhalte, die von KI-Text- 
generatoren erzeugt werden, spiegeln z.T. deutlich das Trainingsmaterial wider, 
was sich etwa in verzerrten Repräsentationen bestimmter sozialer Gruppen zeigt'° 
sowie in einer generell konservativen Tendenz der Systeme, bestehende, in den 
Trainingsdaten aufgefundene Muster zu wiederholen und zu verstärken." Auch 
wenn im Training gezielt Vorkehrungen gegen einen solchen Bias getroffen werden, 
zeigt sich, dass diese Sicherheitsvorkehrungen von den Nutzenden umgangen 
werden können oder aber die Leistungsfähigkeit des Systems einschränken. 

Weitere Grenzen, die sich aus der Konstruktion der Systeme ergeben, betreffen 
deren Transparenz und Nachhaltigkeit. So ist in Bezug auf den Schutz persönlicher 
Daten kaum transparent, welche Daten Eingang in die Modelle gefunden haben und 
wie sie in ihnen repräsentiert sind.** Außerdem wird davor gewarnt, ChatGPT 
sensible Daten im Zuge der Nutzung zu übermitteln, da nicht klar ist, in welcher 
Form diese durch das System bzw. seine Betreiber verwertet werden." KI-Textge- 
neratoren benötigen aufgrund ihrer hohen Hardwareansprüche beim Training 
große Mengen an Ressourcen, was unter anderem zu hohen klimaschädlichen 
Emissionen führt.” Auch wenn Rechenzentren an Strategien für effizientere Pro- 


15 Kevin Roose, „Bing’s A.I. Chat: ‚I Want to Be Alive“, New York Times, 2023, in [nytimes.com/2023/ 
02/16/technology/bing-chatbot-transcript.html] (Zugriff: 15.10.2023). 

16 Davey Alba, „OpenAl Chatbot Spits Out Biased Musings, Despite Guardrails“, Bloomberg, 2022, in 
[www.bloomberg.com/news/newsletters/2022-12-08/chatgpt-open-ai-s-chatbot-is-spitting-out-biased- 
sexist-results] (Zugriff: 15.10.2023). 

17 Cory Doctorow, „Our Neophobic, Conservative AI Overlords Want Everything to Stay the Same“, 
Blog/LA Review of Books, 2020, in [https://blog.lareviewofbooks.org/provocations/neophobic-conser 
vative-ai-overlords-want-everything-stay/] (Zugriff: 15.10.2023); Paola Lopez, „ChatGPT und der Un- 
terschied zwischen Form und Inhalt“, Merkur, Bd. 77(891), 2023, 21-22. 

18 Uri Gal, „ChatGPT is a data privacy nightmare. If you’ve ever posted online, you ought to be 
concerned“, The Conversation, 2023, in [https://theconversation.com/chatgpt-is-a-data-privacy-night 
mare-if-youve-ever-posted-online-you-ought-to-be-concerned-199283] (Zugriff: 15.10.2023). 

19 Melissa Heikkilä, „Could ChatGPT do my job?“, MIT Technology Review, 2023, in [www.technology 
review.com/2023/01/31/1067436/could-chatgpt-do-my-job/] (Zugriff: 15.10.2023). 

20 Emily M. Bender et al., „On the Dangers of Stochastic Parrots: Can Language Models Be Too Big?“, 
Proceedings of the 2021 ACM Conference on Fairness, Accountability and Transparency, 2021, 610-623; 
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zesse arbeiten,” stellt das derzeitige Wachstum sowohl der Größe der Systeme als 
auch ihrer Nutzung in ökologischer Hinsicht ein Problem dar. 


2.4 Auf die Anwendung kommt es an! 


Was technisch möglich oder nicht möglich ist, steckt nur den Rahmen ab, in dem das 
Potenzial von KI-Textgeneratoren durch die konkrete Nutzung ausgeschöpft werden 
kann oder in dem sich möglicherweise unerwünschte Effekte ergeben. Die bishe- 
rigen innovativen Ideen für die Nutzung von KI-Textgeneratoren zeigen, dass dieser 
Rahmen sehr weit gesteckt ist. Neben Programmierung, kreativen Tätigkeiten und 
Anwendungen in Unternehmen werden im TAB-Hintergrundpapier Anwendungen 
in den Bereichen Gesundheit, Information und Öffentlichkeit, Rechtswesen, öf- 
fentlicher Verwaltung sowie Bildung und Forschung dargestellt und ihre möglichen 
Auswirkungen untersucht. Da sich die Entwicklung noch immer rasant vollzieht 
und immer neue Anwendungsmöglichkeiten erdacht oder realisiert werden, lässt 
sich nur skizzieren, welche Implikationen mit der Nutzung von KI-Textgeneratoren 
in den jeweiligen Bereichen verbunden sind. Dies soll im Folgenden exemplarisch 
anhand der Bereiche Gesundheitsversorgung, Öffentliche Kommunikation und 
Forschung gezeigt werden. 

KI-Anwendungen für die Verbesserung der Gesundheitsversorgung werden 
schon seit längerem erforscht, bisher konnte in einzelnen Bereichen wie etwa der 
Radiologie ein Nutzen nachgewiesen werden.” In Bezug auf KI-Textgeneratoren 
werden hohe Erwartungen formuliert, etwa was die Unterstützung ärztlicher Dia- 
gnosen oder den Zugang zu therapeutischen Gesprächen bei psychischen Proble- 
men angeht.” Bisherige KI-gestützte Assistenzsysteme haben die Erwartungen je- 
doch nicht erfüllen können,”* die mangelnde Genauigkeit von KI-Textgeneratoren in 
Bezug auf Fakten wirft auch für die Zukunft Zweifel auf. Der Einsatz von KI-ba- 
sierten Chatbots zur Diagnose und Therapieunterstützung bei psychischen Pro- 


21 Reinhard Grünwald/Claudio Caviezel, Energieverbrauch der IKT-Infrastruktur, Berlin 2022. 

22 Deutscher Ethikrat, Mensch und Maschine — Herausforderungen durch Künstliche Intelligenz. 
Stellungnahme, Berlin 2023, 140ff.; Katrin Gerlinger, Data-Mining - gesellschaftspolitische und 
rechtliche Herausforderungen, Berlin 2022. 

23 Rob Toews, „A Wave Of Billion-Dollar Language AI Startups Is Coming“, Forbes, 2022, in [for- 
bes.com/sites/robtoews/2022/03/27/a-wave-of-billion-dollar-language-ai-startups-is-coming/] (Zugriff: 
15.10.2023); Ron Li/Andre Kumar/Jonathan H. Chen, „How Chatbots and Large Language Model 
Artificial Intelligence Systems Will Reshape Modern Medicine. Fountain of Creativity or Pandora’s 
Box?“, JAMA Internal Medicine, Bd. 183(6), 2023, 596-597. 
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blemen bietet zwar durchaus Potenziale, etwa in Fällen, in denen keine Therapie 
verfügbar ist oder wenn Betroffene es bevorzugen, sich einer Maschine anstelle 
eines Menschen anzuvertrauen.” Allerdings ist die Qualitätskontrolle bislang 
mangelhaft, die Funktionsweise und der Umgang mit persönlichen Daten intrans- 
parent und es fehlt an einer Anbindung an das soziale Umfeld der Nutzenden, um 
im Falle einer Krise reagieren zu können.” Eine zunehmende Verbreitung KI-ba- 
sierter Chatbots könnte zudem einen Anstieg der Zahl psychischer Erkrankungen 
mit sich bringen, etwa durch eine übermäßige Abhängigkeit von den als Kommu- 
nikationspartner angesehenen Systemen. 

In Hinblick auf öffentliche Kommunikation wird unter anderem das Szenario 
diskutiert, dass automatisiert erstellte Beiträge den öffentlichen Diskurs zuneh- 
mend beeinflussen. Solche Beiträge spielen bereits seit einigen Jahren eine Rolle im 
Journalismus, könnten jedoch durch KI-Textgeneratoren eine neue Dimension er- 
reichen. Erste Medienhäuser haben ChatGPT bereits eingesetzt (und Journa- 
list*innen ersetzt), die dabei auftretenden Falschinformationen und Plagiate haben 
aber zu negativer Resonanz geführt.”” In einem Experiment des Bayerischen 
Rundfunks mit einem Vorgängermodell von ChatGPT erwiesen sich die Texte als so 
überarbeitungsbedürftig, dass der Einsatz nicht effizient erschien.”* 

Die Verlockung, die journalistische Arbeit etwa bei datenintensiven Recherchen 
zu erleichtern bzw. Nischenthemen erschließen zu können, dürfte allerdings an- 
halten. Und da ChatGPT allgemein zugänglich ist, wird erwartet, dass öffentliche 
Kommunikation in traditionellen wie auch sozialen Medien in zunehmendem Maß 
durch KI-Textgeneratoren bestimmt wird. Damit verbunden ist das Risiko einer 
Zunahme von gezielt oder unbewusst verbreiteter Desinformation, manipulativen 
Inhalten oder Deepfakes,” was wiederum zu einem Vertrauensverlust in die öf- 
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fentliche Kommunikation führen kann.’ Als positive Vision lässt sich darauf ver- 
weisen, dass die Anwendung von KI-Textgeneratoren als Übersetzungshilfe die 
Kommunikation zwischen unterschiedlichen Sprachgemeinschaften ebenso wie 
zwischen Menschen unterschiedlicher Sprachkompetenz erleichtern und zu einem 
stärkeren Austausch zwischen diesen Gruppen beitragen kann. 

Im Bereich der Forschung wird schließlich die Technologie der KI-Textgene- 
ratoren erprobt, um Experimente zu designen und zu automatisieren?’ und um 
Strukturen und Muster in Daten, etwa der biomedizinischen Forschung, zu iden- 
tifizieren.”” Während die Systeme in diesen Fällen Erkenntnis schaffen sollen, 
werden sie in vielen Fällen bereits als Hilfsmittel genutzt.” Sie können Überset- 
zungen und sprachliche Verbesserungen von Texten liefern oder die Recherche 
erleichtern, indem sie Zusammenfassungen erstellen und Suchfunktionen ergän- 
zen. Sie können Code für wissenschaftliche Software generieren oder Anregungen 
für Fragestellungen geben, Forschungslücken identifizieren und Antragstexte ver- 
bessern. Auch die Unterstützung von Reviewprozessen oder die Auswertung und 
Verschriftlichung von Forschungsdaten werden diskutiert.** Eine Autorschaft von 
KI-Textgeneratoren wird bislang abgelehnt mit der Begründung, nur Menschen 
könnten die Verantwortung für die veröffentlichten Ergebnisse übernehmen.?° 
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Viele der bisher genannten problematischen Aspekte einer Nutzung von 
ChatGPT betreffen auch die Forschung,”° zudem könnten sich bestehende Probleme 
der Wissenschaft wie der Publikationsdruck, die Arbeitslast, der Konkurrenzdruck 
und die Schwierigkeit, hochwertige Informationen von minderwertigen zu unter- 
scheiden, noch verstärken.” Eine offene Frage ist, wie sich die Nutzung von KI- 
Textgeneratoren auf die Ungleichheit im Wissenschaftssystem auswirkt. Zum einen 
könnte etwa die sprachliche Benachteiligung nicht-englischsprachiger Forschender 
gemildert werden, zum anderen könnten sich hinsichtlich des Zugangs zu leis- 
tungsfähigen KI-Systemen sowie der für ihren effektiven Einsatz benötigten Kom- 
petenzen neue Benachteiligungen einstellen (bzw. alte verstärkt werden). 

Inwieweit sich die hier skizzierten gesellschaftlichen Implikationen einer 
breiteren Anwendung von KI-Textgeneratoren realisieren, ist auch ein Jahr nach 
Veröffentlichung von ChatGPT noch nicht absehbar. Während die Technologie 
weiterentwickelt und dabei vielfältiger wurde, verlief diese Entwicklung evolutio- 
när im Rahmen der Möglichkeiten und Grenzen der bisherigen Systeme. Die an- 
fangs sehr intensive Öffentliche Debatte hat sich ebenfalls ausdifferenziert, an die 
Stelle des massenmedialen Hypes sind verschiedene spezialisierte Diskussionen in 
den jeweils betroffenen gesellschaftlichen Teilbereichen getreten. Ein großes ge- 
sellschaftliches Interesse an der neuen Technologie und die Bereitschaft, sich damit 
auseinanderzusetzen, kann weiter angenommen werden. Dies gilt auch für den 
politischen Bereich. So wurden neben Bemühungen um eine gesetzliche Regulie- 
rung insbesondere auf Ebene der EU mehrere Ansätze zu einer globalen Beob- 
achtung der Entwicklung gestartet, unter anderem unter dem Dach der Vereinten 
Nationen.”® 


36 Einen Überblick geben Abeba Birhane et al., „Science in the age of large language models“, 
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3 Die Rolle von KI-basierten Textgeneratoren für 
die Praxis der Technikfolgenabschatzung 


Außer als Gegenstand von TA-Untersuchungen können KI-Textgeneratoren die Ar- 
beitsweise der TA auf zwei Ebenen beeinflussen. Zum einen können sie unmittelbar 
die Arbeit verändern, indem sie in zunehmendem Maß als (Hilfs-)Mittel genutzt 
werden. Da die Arbeitsschritte bei TA-Untersuchungen in erster Linie die Bearbei- 
tung von Textmaterialien betreffen, kommt eine Nutzung in nahezu allen Bereichen 
in Betracht. Zum anderen kann eine zunehmende Verbreitung der Systeme in der 
Wissenschaft oder (im Fall von TA als Politikberatung) in der Politik die Rahmen- 
bedingungen von TA-Untersuchungen verändern und sich indirekt auf die Arbeit 
auswirken. 

Potenziale von KI-Textgeneratoren speziell im Bereich der wissenschaftlichen 
Politikberatung werden insbesondere bei der Recherche wissenschaftlicher Evi- 
denz und der Erstellung von Berichten gesehen.?? Im Fall von Recherchen könnten 
KI-Textgeneratoren Zeit sparen, indem sie große Mengen von wissenschaftlichen 
oder medialen Texten durchsuchen, auf die in ihnen verhandelten Fragestellungen, 
Methoden und Ergebnissen hin analysieren und so die Erstellung von Literatur- 
übersichten zum Forschungsstand oder von Analysen des medialen Diskurses er- 
leichtern oder dabei helfen, unberücksichtigte Perspektiven zu entdecken. Dabei 
könnte auch eine größere Zahl von Sprachen berücksichtigt werden, als es bei allein 
menschlicher Bearbeitung möglich ist. Berichte für Entscheidungsträger*innen 
folgen meist einem inhaltlichen Muster, werden allerdings unter hohem Zeitdruck 
erstellt. Hier könnten KI-Textgeneratoren für erste Entwürfe einzelner Abschnitte 
(Management Summary, Zusammenfassung des Forschungsstands oder der gel- 
tenden Regulierung) eingesetzt werden und so die Erstellung einer endgültigen 
Fassung beschleunigen. Perspektivisch wird auch eine automatisierte individuelle 
Anpassung von Berichten an die Interessen der jeweiligen Lesenden diskutiert.*° 

Erste Experimente mit aktuell verfügbaren KI-Textgeneratoren zeigen aller- 
dings die Probleme, die dabei entstehen.“ So erfordert die Bewertung von wis- 
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senschaftlicher Evidenz oder von politischen Optionen ein Urteilsvermögen, das 
sich aus Erfahrungen und Werten im Bezug zur realen Welt speist und keinen 
Verzerrungen durch die Orientierung an spezifisch ausgewählten Daten unterliegt. 
KI-generierte Texte werden zudem bislang als zu vorhersehbar und am Erwart- 
baren orientiert beurteilt, was sie für Politikberatung weniger geeignet macht. Bei 
Zusammenfassungen kann es zur Auslassung relevanter Aspekte kommen, wie 
generell die Zuverlässigkeit der KI-Textgeneratoren gering ist und aufwendige 
Prüfungen erforderlich macht. Und solange ein vertraulicher und datenschutz- 
konformer Umgang mit den eingegebenen Daten nicht sichergestellt ist, verbietet 
sich eine Nutzung im Zusammenhang mit sensiblen persönlichen oder anderweitig 
schützenswerten Informationen. Es bleibt angesichts dieser Eindrücke abzuwarten, 
inwieweit sich die in Studien berichteten Produktivitätssteigerungen”” auch im 
Bereich der TA realisieren lassen. 

Neben diesen unmittelbar ersichtlichen Herausforderungen können auch in- 
direkte Effekte der Nutzung sowohl im Zuge von TA-Untersuchungen als auch im 
wissenschaftlichen oder politischen Umfeld der TA auftreten. So kann sich die 
Qualität wissenschaftlicher Texte schleichend verschlechtern, falls Fehler oder Bias 
der KI-Systeme nicht entdeckt werden und Eingang in die Texte finden; langfristig 
kann dies einem Verlust des Vertrauens Vorschub leisten, zu dem auch eine feh- 
lende Transparenz bezüglich der Nutzung von KI-Textgeneratoren bei der Erstel- 
lung bzw. Verbreitung von Publikationen beitragen kann. Wie Baird am Beispiel 
wissenschaftlicher Instrumente gezeigt hat, sind technische Geräte zudem nicht 
wertfrei, sondern durch Designentscheidungen und ihren Entstehungskontext ge- 
prägt.” Bei ChatGPT wurde ein tendenziell links-liberaler politischer Einschlag in 
den Texten identifiziert,** eine stärkere Nutzung dieses Systems in der wissen- 
schaftlichen Politikberatung könnte daher dem Anspruch auf Überparteilichkeit 
entgegenstehen. Nicht zuletzt könnten aufgrund der Orientierung der KI-Systeme 
an bestehenden Mustern gerade solche gesellschaftlichen Perspektiven übersehen 
werden, die neu und innovativ und daher noch nicht im Trainingsmaterial der KI- 
Systeme repräsentiert sind. Solche politischen Risiken der Anwendung stellen sich 
zusätzlich zu den genannten praktischen Problemen und lassen eine Nutzung au- 
ßerhalb von Experimenten gegenwärtig fraglich erscheinen. 


42, Shakked Noy/Whitney Zhang, „Experimental evidence on the productivity effects of generative 
artificial intelligence“, Science, Bd. 381(6654), 2023, 187-192. 

43 Davis Baird, Thing Knowledge. A Philosophy of Scientific Instruments, Berkeley 2004. 

44 David Rozado, „The Political Bias of ChatGPT“, Social Sciences, Bd. 12(3), 2023 (DOI: 10.3390/soc- 
sci12030148), 148. 
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4 Offenheit und Skeptizismus als Leitlinien 


Wissenschaft als Institution sollte grundsätzlich offen für Beiträge aus allen mög- 
lichen Quellen sein, so lässt sich, etwas verkürzt, die Norm des Universalismus in 
Mertons Konzeption von Wissenschaft verstehen.”° Aus heutiger Perspektive kann 
das auch die Beiträge von KI-Textgeneratoren einschließen, auch wenn bisher 
Konsens herrscht, dass sie keine originäre Schöpfung darstellen, sondern nur im 
Verbund mit menschlichem Handeln zu sehen sind. Gerade diese Verbundenheit 
von nichtmenschlicher und menschlicher Produktion (nicht allein wissenschaftli- 
cher) Texte wird in jüngerer Zeit theoretisch immer stärker in den Blick genommen. 
Im Poststrukturalismus wird die intertextuelle Qualität von Texten herausgestellt, 
bis hin zur plakativen Ausrufung des „Tods des Autors“. Ausgehend von der Wis- 
senschaftssoziologie setzt sich die Anerkennung durch, dass Wissenschaft eine 
kollektive und sozial eingebundene Tätigkeit ist, worauf etwa Merton am Beispiel 
der metaphorischen Redewendung hinweist, wissenschaftlicher Fortschritt erfolge 
immer „von den Schultern von Riesen aus“.* Mit der Akteur-NetzwerkTheorie*’ 
und der Systemtheorie*® stehen gleich mehrere theoretische Ansätze bereit, mit 
denen sich das Verhältnis und das Zusammenwirken von menschlichen und 
nichtmenschlichen Aktanten in der wissenschaftlichen Praxis beschreiben und 
analysieren lässt. 

Nicht nur im Sinn der wissenschaftlichen Offenheit und Neugier sind Erpro- 
bungen und Weiterentwicklungen des Verhältnisses zwischen Forschenden und KI- 
Textgeneratoren interessant und wünschenswert, auch angesichts der gesell- 
schaftlichen Herausforderungen, mit denen sich die Technikfolgenabschätzung und 
die Wissenschaft insgesamt beschäftigen, ist technische Unterstützung grundsätz- 
lich höchst willkommen (und kommt bereits vielfach zum Einsatz). Die vielen 
aufgeworfenen Fragen und Probleme machen aber deutlich, dass für das skizzierte 
Zusammenwirken von Mensch und KI-basierter Maschine neue Regelungen nötig 
sind, sowohl auf gesetzlicher Ebene als auch beispielsweise in Form von Standards, 
Tests bzw. Benchmarks und Richtlinien guter wissenschaftlicher Praxis. Merton hat 
der Norm des Universalismus die Norm des organisierten Skeptizismus an die Seite 


45 Robert K. Merton, „The normative structure of science“, in The Sociology of Science, hg. von 
dems., Chicago/London 1973, 267-278. 

46 Robert K. Merton, On the Shoulders of Giants. A Shandean Postscript, New York 1965. 

47 Bruno Latour, „Zirkulierende Referenz. Bodenstichproben aus dem Urwald am Amazonas“, in 
Die Hoffnung der Pandora. Untersuchungen zur Wirklichkeit der Wissenschaft, hg. von dems., 
Frankfurt a.M. 2000, 36-95. 

48 Elena Esposito, Artificial Communication. How Algorithms Produce Social Intelligence, Cam- 
bridge/London 2022. 
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gestellt, also des grundsätzlichen Infragestellens „jedes Aspekts von Natur und 
Gesellschaft“.* Ein solcher Skeptizismus erscheint auch gegenüber den Ergebnissen 
von KI-Textgeneratoren angebracht, die sich gerade nicht durch Unsicherheit in 
Bezug auf die eigenen Aussagen auszeichnen und daher Prinzipien der Wissen- 
schaftlichkeit entgegenlaufen. 

Die Rolle der TA kann dabei sein, über die Möglichkeiten und Grenzen von KI- 
Textgeneratoren im Rahmen wissenschaftlicher Praxis aufzuklären und dabei zu 
helfen, auch indirekte Effekte und Pfadabhängigkeiten zu berücksichtigen. Sie kann 
auch aufzeigen, welche Art von Weiterentwicklungen aus der Perspektive der 
Wissenschaft wünschenswert sind, um den jeweiligen Problemstellungen besser 
gerecht zu werden. Die auf diesen Erkenntnissen basierende wissenschaftsinterne 
Reflexion der technologischen Entwicklung kann dazu beitragen, die treibenden 
Kräfte und möglichen Folgen dieser Entwicklung besser zu verstehen und sie ver- 
antwortungsvoll auf die Realisierung der beachtlichen Potenziale auszurichten, 
insbesondere, wenn dabei vielseitige und ausgewogene Expertise zum Tragen 
kommt. 


49 Merton 1973, 277. 
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Vom Spannungs- zum Gestaltungsfeld 


Abstract: The already existing field of tension in university teaching - formed by the 
three complex poles of practice, science and person - is massively influenced by the 
implementation of Al in the field of university action. Regardless of whether it is 
used in the design of university teaching or not. In this sense, Al acts as an amplifier 
and accelerator of the tense demands on teaching. How does AI change the relati- 
onships within the field oftension between practice, science, and person? How does 
AI change the disciplines and their research, as well as activities outside the uni- 
versity, and how should these changes be considered in university teaching? A 
proactive path is to be paved by finding concrete fields of action and identifying 
actors. The thought pattern of Ludwig Huber could inspire the formulation of 
concrete questions and categories for a structured discussion of AI in university 
teaching and the creation of a basic state of values. 


1 Problemstellung 


Spätestens seit der Veröffentlichung des Sprachmodells GPT3 ist der Einsatz von 
Künstlicher Intelligenz (KI) eines der gefragtesten Themen im aktuellen Hoch- 
schuldiskurs. Bemerkenswert ist dabei, wie polarisierend KI-gestütztes Lehren und 
Lernen auf Akteure in der Hochschule wirkt: Während die einen KI in der Hoch- 
schulbildung mit optimistischen bis euphorischen Automatisierungsvorstellungen 
von Lehren und Lernen begegnen, zeigen sich andere kritisch bis ablehnend. 
Zwischentöne sind ebenfalls vertreten, scheinen aber tendenziell schwerer zu fal- 
len. Der deutsche KI-Diskurs im Hochschulkontext wird derzeit zum einen von KI- 
Zukunftsszenarien geprägt, die sich dem Thema tendenziell einseitig, bisweilen 
auch oberflächlich, nähern und der Komplexität von Hochschulbildung nicht ge- 
recht werden.’ Zum anderen wird der KI-Einsatz durch eigene Förderlinien und 
entsprechende Forschungsprojekte bestimmt,” die sich auf die Entwicklung und 


1 Johannes Schleiss et al., Künstliche Intelligenz in der Bildung. Drei Zukunftsszenarien und fünf 
Handlungsfelder, Berlin 2023. 
2 Bundesregierung, „Strategie Künstliche Intelligenz der Bundesregierung. Fortschreibung 2020“, 
2020 in [https:/www.ki-strategie-deutschland.de/files/downloads/201201_Fortschreibung_KI-Strate 
gie.pdf] (Zugriff: 11.09.2023). 


8 Open Access. © 2024 bei den Autorinnen und Autoren, publiziert von De Gruyter. Dieses Werk ist 
lizenziert unter einer Creative Commons Namensnennung - Nicht kommerziell - Keine Bearbeitung 4.0 International 
Lizenz. https:/doi.org/10.1515/9783111351490-004 
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begleitende Erforschung bestimmter technologischer Anwendungen konzentrieren 
und die schnelle Entwicklung insbesondere von ChatGPT kaum aufnehmen können. 
Zu beobachten ist ein wachsender Druck auf Hochschulen, Richtlinien und Orien- 
tierungen für den KI-Einsatz in der Lehre zu entwickeln - eine herausfordernde 
Aufgabe, da es an gesicherten Erkenntnissen dazu fehlt. Zudem ist die Dynamik auf 
dem technologischen Sektor so hoch, dass es wenig Sinn ergibt, sich auf aktuelle 
Werkzeuge wie ChatGPT zu konzentrieren. Notwendig wären umfassende und 
grundlegende Konzepte zum Umgang mit KI im Hochschulbereich. Genau die aber 
fehlen, wie beispielsweise die Stellungnahme des Ethikrates veranschaulicht, in der 
Wissenschaft und Lehre nicht thematisiert werden.” 

Wir wollen im vorliegenden Text den Fokus auf Universitäten richten und eine 
bildungstheoretische Reflexion dazu anregen, wie man den Umgang mit KI (bezo- 
gen auf Sprachmodelle und andere KI-Anwendungen) sowohl in der Breite als auch 
in der Tiefe kontextspezifisch untersuchen und dann auch praktisch gestalten kann. 
Ziel unseres Beitrags ist es, das Verhältnis von KI und universitärer Lehre so zu 
thematisieren, dass Raum für die Diskussion unterschiedlicher Problemlagen, 
Wechselwirkungen und Spannungen, aber auch Potenziale entsteht. Notwendig 
erscheint uns eine ausgewogene und realistische Diskussion der Möglichkeiten von 
KI für die Hochschulbildung, die Lehrende und Forschende in die Lage versetzt, 
proaktiv KI-Szenarien zu entwickeln und zu erproben sowie spezifische KI-Themen 
im Kontext Universität einzuordnen. 

Der Beitrag knüpft an diese Problemskizze an, indem er eine hochschul- 
didaktische Denkfigur mit KI-gestütztem Lehren und Lernen verbindet und wei- 
terdenkt: das Spannungsfeld der Hochschuldidaktik* von Ludwig Huber, das in 
Abschnitt 2 zunächst vorgestellt und rekonstruiert wird. Anschließend führen wir 
in Abschnitt 3 zwei Kategorien von KI-Anwendungen ein, die das Spannungsfeld 
universitärer Lehre derzeit verstärken. Inwiefern sie das tun und welche Reflexi- 
ons- und Orientierungsfragen sich damit formulieren lassen, ist Gegenstand von 
Abschnitt 4. Der folgende Abschnitt 5 beschäftigt sich mit den Handlungsfeldern der 
curricularen und methodischen Gestaltung universitärer Lehre in Zeiten von KI, 
greift zur Veranschaulichung zwei Beispiele heraus und diskutiert kurz die Rolle 
verschiedener Akteure; Hubers Denkfigur ziehen wir hier zur Strukturierung 
unserer Argumentation heran. Im abschließenden Abschnitt 6 plädieren wir für 
eine wertebasierte Diskussion als Grundlage für die Weiterentwicklung universi- 


3 Deutscher Ethikrat, Mensch und Maschine — Herausforderungen durch Künstliche Intelligenz, 
Berlin 2023, 163. 

4 Ludwig Huber, „Hochschuldidaktik als Theorie der Bildung und Ausbildung“, in Ausbildung und 
Sozialisation in der Hochschule, Enzyklopädie Erziehungswissenschaft, Bd. 10, Stuttgart 1983, 127-129. 


KI in der universitären Lehre — 31 


tärer Lehre und versuchen exemplarisch zu zeigen, dass dies eine Chance ist, aus 
dem Spannungsfeld ein Feld konstruktiven Gestaltens zu machen. 


2 Universitäre Lehre im Spannungsfeld 


In Anlehnung an einen als Klassiker geltenden Enzyklopädie-Artikel zur 
Hochschuldidaktik von Ludwig Huber kann man festhalten, dass die Universität 
(nach wie vor) drei Funktionen zugleich ausfüllt: Sie ist eine Bildungseinrichtung, 
soll umfassend qualifizieren und dient damit im weitesten Sinne der Praxis. Sie ist 
zudem Teil des Wissenschaftssystems, soll neues Wissen generieren und fördert 
Nachwuchswissenschaftlerinnen. Schließlich ist sie Lebens- und Arbeitswelt ihrer 
Mitglieder und soll diesen Personen Bildung ermöglichen und Forschungsfreiraum 
gewähren.’ In diesem Sinne hat die Universität als Institution einen Bezug zur 
Praxis, Wissenschaft und Person. Das gilt gleichermaßen für die universitäre Lehre, 
denn auch sie dient der Praxis, Wissenschaft und Person (siehe Abb. 1). 


Wissenschaft Praxis 
Fachwissenschaften Berufliche Praxis | 


t| — tl | 


Wissenschaft an sich Gesellschaftliche Praxis 


Universitäre / 
7 


Person 
als Individuum 


t] 


als soziales Wesen 


Abbildung 1: Spannungsfeld universitärer Lehre nach Huber (1983). 


Nun harmonieren Maßnahmen und Strategien, die den Personenbezug ins Zentrum 
stellen, keineswegs immer mit Maßnahmen und Strategien, die den Praxis- und/ 
oder Wissenschaftsbezug stärken, und vice versa. Praxis, Wissenschaft und Person 
bilden so gesehen die Pole eines Spannungsfelds, das im Zuge gesellschaftlicher und 
technologischer Entwicklungen dynamisch ist. In diesem Spannungsfeld bewegt 
sich universitäre Lehre. 


5 Huber 1983, 127-129. 
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Über 30 Jahre später hat der Wissenschaftsrat in einem Empfehlungspapier 
drei Dimensionen akademischer Bildung postuliert, die in allen Studiengängen in 
ein ausgeglichenes Verhältnis zu bringen seien: (Fach-)Wissenschaft, Persönlich- 
keitsbildung und Arbeitsmarktvorbereitung.® Diese Aussagen ähneln in vieler 
Hinsicht der frühen Denkfigur Hubers. Auch der Wissenschaftsrat kennzeichnet 
drei Zwecke universitärer Lehre als gleich wichtig, hebt Spannungsmomente hervor 
und mahnt Anstrengungen an, diese auszubalancieren. Eine Besonderheit in Hu- 
bers Denkfigur, die sich in dieser Form beim Wissenschaftsrat nicht findet, ist der 
vertiefende Blick auf die Pole, die das Spannungsfeld bilden.’ Diese sind nämlich 
keineswegs homogen, sondern ihrerseits komplexe und spannungsreiche Konstel- 
lationen: 

- So berührt Praxis, hier gemeint als die Praxis außerhalb der Institution Uni- 
versität, keineswegs nur die berufliche Praxis oder (wie der Wissenschaftsrat 
schreibt) den Arbeitsmarkt, sondern auch andere gesellschaftliche Praxis- 
bereiche wie Politik und Kultur - im Englischen treffend als Citizenship be- 
zeichnet, was auf alles verweist, was Menschen als mündige Bürgerinnen und 
Bürger betrifft. Berufliche und gesellschaftliche Praxis in diesem Sinne können 
ihrerseits Ansprüche stellen oder Normen vertreten, die untereinander kon- 
kurrieren. 

— Auch die Wissenschaft als Bezugspunkt universitärer Lehre ist in sich nicht 
widerspruchsfrei: Die Gesamtheit aller Wissenschaften, Abgrenzungsversuche 
der Wissenschaft zu anderen Formen der Wissensgenerierung und die Suche 
nach dem Gemeinsamen von Wissenschaft stehen auf der einen Seite. Auf der 
anderen Seite finden sich eine zunehmende Ausdifferenzierung und Speziali- 
sierung von Fachwissenschaften und Subdisziplinen, die immer mehr in die 
Tiefe gehen und sich untereinander auseinanderbewegen. 

— Selbst der Blick auf die Person als ein Pol des Spannungsgefüges kann Wider- 
sprüche zutage fördern. Forschende, Lehrende und Studierende sind sowohl 
Individuen mit eigenen Ansprüchen als auch soziale Wesen und damit Mit- 
glieder einer Gemeinschaft beispielsweise mehrerer Gemeinschaften zugleich, 
was Zielkonflikte und Streitpotenzial birgt. 


6 Wissenschaftsrat, Empfehlungen zum Verhältnis von Hochschulbildung und Arbeitsmarkt — 
Zweiter Teil der Empfehlungen zur Qualifizierung von Fachkräften vor dem Hintergrund des de- 
mographischen Wandels, 2015 in [https:/www.wissenschaftsrat.de/download/archiv/4925-15.html] 
(Zugriff: 11.09.2023). 
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3 KI als Spannungsverstarker 


Universitäre Lehre liegt also — unabhängig von der Entwicklung digitaler Techno- 
logien und KI - bereits in einem Spannungsfeld. Damit ist zumindest erklärbar, 
warum die Gestaltung universitärer Lehre generell eine komplexe Herausforde- 
rung ist, für deren Bewältigung eindimensionale Schemata und einseitige Szenarien 
ungeeignet sind. Selbst wenn man sich dazu entscheiden würde (falls das ginge), KI 
aus der universitären Lehre herauszuhalten, ließe sich nicht verhindern, dass diese 
(weiter) die gesellschaftliche und berufliche Praxis, die Wissenschaft an sich und 
die fachwissenschaftliche Forschung sowie Menschen als Einzelpersonen und Teil 
kollektiver Systeme massiv beeinflusst. Was aber meint KI im Kontext universitärer 
Lehre? 

Seitdem das Sprachmodell GPT3 um die Jahreswende 2022/23 veröffentlicht 
wurde, scheint Chat-GPT in der breiten hochschulöffentlichen Meinung zum Syn- 
onym für KI geworden zu sein. Im Vergleich dazu ist die Entwicklung und Erfor- 
schung anderer KI-Anwendungen im Hochschulkontext in den letzten Jahren jen- 
seits der Expertinnenkreise geradezu unbemerkt verlaufen: Gemeint sind etwa KI- 
basierte Vorhersagemodelle zur Identifikation von Risikostudierenden, adaptive 
Lernumgebungen, intelligente tutorielle Systeme, KI-gestützte Assessment- und 
Evaluationstools etc.® Mit KI-Anwendungen dieser Art erhofft man sich, Studierende 
individueller betreuen, Lernangebote bedarfsorientiert anpassen und damit Stu- 
dienerfolg fördern zu können.’ Zudem wird erwartet, Lehrende durch Daten- 
analysen besser über studentische Bedürfnisse informieren und den Betreuungs- 
aufwand minimieren zu kénnen.”’ Im Vergleich zu einigen anderen Ländern wurde 
die Forschung zu KI in der Hochschulbildung in Deutschland eher spät durch 
Förderrichtlinien des Bundesministeriums für Bildung und Forschung” den 2019 


8 Olaf Zawacki-Richter et al., „Systematic review of research on artificial intelligence applications in 
higher education - Where are the educators?“, International Journal of Educational Technology in 
Higher Education, 2019. 

9 Claudia de Witt et al., Künstliche Intelligenz in der Hochschulbildung, Berlin 2020; Clara Schu- 
macher/Dirk Ifenthaler, „Investigating prompts for supporting students’ self-regulation: A remaining 
challenge for learning analytics approaches?“, The Internet and Higher Education, Bd. 49, 2021. 

10 Danny Glick et al., „Predicting Success, Preventing Failure“, in Utilizing Learning Analytics to 
Support Study Success, hg. von Dirk Ifenthaler et al., Cham 2019; de Witt et al. 2020. 

11 Bundesministerium für Bildung und Forschung, Bekanntmachung. Richtlinie zur Bund-Lander- 
Initiative zur Förderung der Künstlichen Intelligenz in der Hochschulbildung, 2021 [www.bmbf.de/ 
foerderungen/bekanntmachung-3409.html] (Zugriff: 11.09.2023). 
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gegründeten KI-Campus'” und diverse andere Initiativen vorangetrieben — mit 
durchaus großen Geldsummen und dennoch nicht ansatzweise so öffentlichkeits- 
wirksam, wie das im Falle des kommerzielles KI-Werkzeugs ChatGPT zu beobachten 
ist. GPT3"° hat zusammen mit anderen frei verfügbaren KI-Werkzeugen wie 
Übersetzungs- oder Recherchehilfen das universitäre Lehren und Lernen geradezu 
wachgerüttelt. Obschon auch „ältere“ KI-Anwendungen wie adaptive Lernumge- 
bungen oder intelligente tutorielle Systeme Einfluss darauf nehmen, wie wir uns 
universitäre Lehre vorstellen können, führen erst ChatGPT und Co. dazu, die uni- 
versitäre Lehre und deren Zukunft radikal zu hinterfragen. Das hat mehrere 
Gründe: Sprachmodelle wie GPT haben eine unmittelbare Wirkung auf den Kern 
akademischen Denkens und Handelns, das in hohem Maße mit der Produktion von 
Texten verknüpft und damit (fachspezifisch unterschiedlich) sprachbasiert ist. Sie 
nehmen zudem kaum kontrollierbar Einfluss auf die bestehende Lehre, indem 
Studierende frei verfügbare KI-Tools im Studium schlichtweg nutzen, ob das nun 
vorgesehen ist oder nicht. Der Handlungsdruck auf die universitäre Lehre wächst 
entsprechend: Derzeit werden vor allem Missbrauchspotenziale der neuen KI- 
Werkzeuge debattiert und entsprechend gefährdete Prüfungsformate in Frage ge- 
stellt, aber auch ein Experimentieren mit den neuen (kommerziellen) Tools in der 
Lehre empfohlen.'* 

Zu unterscheiden sind im aktuellen Hochschuldiskurs folglich zwei Kategorien 
von KI-Anwendungen: erstens KI-Anwendungen, die von Hochschulen offiziell, aber 
weniger offentlichkeitswirksam eingeführt werden und Lern-Management-Systeme 
ersetzen oder ergänzen könnten; zweitens kommerzielle KI-Werkzeuge, die von 
außen — über deren Bedeutung in der Praxis und die Nutzung durch Forschende 
und Studierende - in die Hochschulbildung massiv hineinwirken. Die beiden Ka- 
tegorien stehen nicht unbedingt in Konkurrenz zueinander; vermutlich werden sie 
künftig sogar zusammen gedacht werden und könnten dann nochmals verstär- 
kende und beschleunigende Wirkung entfalten. 


12 Stifterverband, Deutsches Forschungszentrum für Künstliche Intelligenz GmbH, Hasso-Plattner- 
Institut, mmb Institut GmbH, & NEOCOSMO GmbH. 

13 Anika Limburg et al., „Plagiarismus in Zeiten Künstlicher Intelligenz“, Zeitschrift für Hoch- 
schulentwicklung, Bd. 17(3), 2022, 91-106. 

14 Rahul Kumar et al., „AI & Al: „Exploring the contemporary intersections of artificial intelligence 
and academic integrity“, University of Calgary’s Digital Repository 2022, in [http://hal.handle.net/ 
1880/114647] (Zugriff: 11.09.2023). 
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4 KI im Spannungsfeld universitarer Lehre 


Universitäre Lehre bewegt sich also unweigerlich in einem nun auch von KI 
mitbestimmten Spannungsfeld. Daraus kénnte man folgern, dass KI in der uni- 
versitaren Lehre schon allein deshalb zu unterschiedlichen bis polarisierenden 
Einschätzungen und diversen als wahrscheinlich und/oder wünschenswert dekla- 
rierten Zukunftsszenarien führt, weil das ohnehin vorhandene Spannungsfeld 
durch KI verstärkt und in seiner Dynamik beschleunigt wird. Komplexe Anforde- 
rungen an die universitäre Lehre aufgrund multipler Zwecke und Sinndimensionen 
treten mit KI also zum einen noch deutlicher hervor und entwickeln zum anderen 
potenziell neue Qualitäten. Unsere These ist, dass man in dieser herausfordernden 
Situation zunächst Orientierung braucht. Die eingeführte Denkfigur von Huber 
könnte eine solche Orientierung bieten.’® 

Bevor man allzu schnell und reaktiv auf äußere Anforderungen KI-Szenarien 
für die Hochschulbildung kreiert und verbreitet, ließe sich mithilfe von Hubers 
Denkfigur zunächst einmal beleuchten, welchen Einfluss KI auf die Pole und die 
Relationen im Spannungsfeld universitärer Lehre nimmt (siehe Abb. 2): Wie ver- 
ändert KI (a) das Handeln außerhalb der Hochschule, (b) Disziplinen und deren 
Forschung und (c) den Menschen bzw. das Menschsein und in welcher Weise ist das 
in der Gestaltung universitärer Lehre zu berücksichtigen und auszubalancieren? 
Wie verändert KI außerdem das Verhältnis (d) zwischen Praxis und Wissenschaft, 
(e) zwischen Wissenschaft und Person und (f) zwischen Person und Praxis, und wie 
kann oder muss man das für die Gestaltung universitärer Lehre heranziehen? 

Wir gehen nicht davon aus, dass diese Fragen direkt und einfach zu beant- 
worten sind. Das ist auch nicht deren Zweck. Vielmehr handelt es sich um Fragen, 
die einerseits aufzeigen, womit wir uns beschäftigen müssen, wenn KI Einzug in die 
universitäre Lehre hält. In diesem Sinne handelt es sich um Reflexionsfragen. Zum 
anderen verweisen die Fragen zusammen mit der Denkfigur auf die Notwendigkeit, 
alle drei Pole und deren Relationen in den Blick zu nehmen und die inhärenten 
Spannungen weder zu übergehen noch einseitig aufzulösen: Jede Konzentration auf 


15 Wir behalten in diesem Text die Denkfigur von Huber (1983) bei, auch wenn Modifikationen 
möglich wären: So ließe sich etwa der Praxispol in Arbeitswelt und Gesellschaft ausdifferenzieren. 
Dies allerdings würde zum einen die Gestalt der Denkfigur und deren Potenzial, die Spannungs- 
momente zwischen allen Polen gleichzeitig zu analysieren, zerstören. Zum anderen gehört es zu 
Hubers Gesamtargumentation, innerhalb des Praxispols Spannungen zwischen gesellschaftlichen 
und beruflichen Erwartungen und Anforderungen zu beleuchten. Schließlich sei noch darauf hin- 
gewiesen, dass „Praxis“ in der Denkfigur kein theoretisch aufgeladener Begriff ist (und entspre- 
chend nicht impliziert, dass es keine Wissenschaftspraxis gäbe), sondern als Dachbegriff für alle 
Kontexte außerhalb des Universitätskontextes steht. 
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Abbildung 2: Die orientierende Funktion der Denkfigur von Huber (1983) für KI in der universitären 
Lehre. 


Argumente, die sich auf nur einen Pol beziehen, führt nämlich zu unangemessenen 
Folgerungen und unausgewogenen KI-Szenarien für die universitäre Lehre. Viel- 
mehr kommt es darauf an, in der Gestaltung von Lehre Wissenschaft, Praxis und 
Person in eine Balance zu bringen. Je nach Kontext (zum Beispiel Studiengang) kann 
diese Balance nicht nur mit unterschiedlichen Gewichtungen (der drei Pole) ar- 
beiten, sondern auch unterschiedliche Leitmetaphern verfolgen (zum Beispiel Ba- 
lance als Waage, als dynamisches Gleichgewicht, als Komplementarität). 

Diesen Gestaltungsaspekt aufgreifend, konkretisieren wir die obigen Fragen 
exemplarisch weiter - wiederum mit der Intention, damit Impulse für eine struk- 
turierte Auseinandersetzung mit KI in der universitären Lehre zu geben und 
mögliche Handlungsfelder aufzuzeigen. 

a. Praxis: Was sollte man angesichts des KI-bedingten Wandels in Arbeit und 
Gesellschaft wissen und können? Wie lassen sich diese neuen, gegebenenfalls 
auch in Widerstreit geratene Anforderungen inhaltlich und methodisch in der 
Lehre aufnehmen? 

b. Wissenschaft: Welche Chancen und Risiken birgt KI für die Wissenschaftswelt? 
Welche neuen Kompetenzprofile erfordern Fachwissenschaften infolge von KI? 
Was davon sollte in welcher Weise inhaltlich und methodisch Eingang in die 
Lehre finden? 

c. Person: Was unterscheidet den Menschen von KI und damit von Maschinen und 
was leitet sich daraus für das Menschsein ab? Wie viel „Maschine“ verträgt der 
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Mensch? Welche Konsequenzen hat das inhaltlich und methodisch fiir die 
Gestaltung von Lehre? 

d. Praxis-Wissenschaft: Wie verändert KI die Interaktion und den Austausch 
zwischen Wissenschaft und Praxis? Welche Auswirkungen hat KI auf die 
Wissenschaftskommunikation und den Wissenstransfer von der Forschung in 
die Arbeitswelt und andere gesellschaftliche Bereiche? Was bedeutet das in- 
haltlich und methodisch für die Gestaltung von Lehre? 

e. Wissenschaft-Person: Wie beeinflusst KI die Möglichkeiten des Menschen zur 
Aneignung von und Mitwirkung an Wissenschaft? Was verlangt der Einsatz von 
KI in der Wissenschaft von Forschenden und solchen, die Forschende werden 
wollen? Was bedeutet das inhaltlich und methodisch für die Gestaltung von 
Lehre? 

f. Person-Praxis: Was verlangt der Einsatz von KI in der Praxis von den Mitglie- 
dern einer Universität als Individuum und Teil einer Gemeinschaft? Welchen 
Einfluss nimmt KI darauf, wie Lehrende und Studierende mit der Praxis in- 
teragieren? Was bedeutet das inhaltlich und methodisch für die Gestaltung von 
Lehre in verschiedenen Studiengängen? 


5 Gestaltung universitarer Lehre in Zeiten von KI 


Als Zwischenfazit lässt sich festhalten: Universitäre Lehre befindet sich aufgrund 
der multiplen Zwecke von Universität grundsätzlich in einem Spannungsfeld - 
gebildet von den drei in sich komplexen Polen Praxis, Wissenschaft und Person. 
Dieses Spannungsfeld wird bereits massiv von KI beeinflusst, unabhängig davon, ob 
man sie in der Gestaltung universitärer Lehre heranzieht oder nicht. In diesem 
Sinne wirkt KI als Verstärker und Beschleuniger spannungsreicher Anforderungen 
an die Lehre. Um diesen nicht nur reaktiv zu begegnen, sondern einen proaktiv 
gestaltenden Weg einzuschlagen, haben wir die Denkfigur von Ludwig Huber als 
Orientierung herangezogen und eine ganze Reihe von Fragen formuliert. 

Diese beispielhaft zu verstehenden Fragen können den komplexen Einfluss der 
verschiedenen KI-Anwendungen und deren Folgen für die universitäre Lehre ein 
wenig entwirren helfen, indem sie sich entlang der Pole Praxis, Wissen und Person 
sowie deren Beziehungen sortieren lassen. Was aber fängt man nun mit solchen 
Fragen an? Aus unserer Sicht haben sie zum einen aus zwei Gründen per se einen 
Wert: Die Fragen machen erstens die Komplexität der aktuellen Situation für die 
Hochschulbildung sichtbar und damit besser greifbar; zweitens heben sie in ihrer 
Anordnung innerhalb der gewählten Denkfigur hervor, dass alle drei Pole legitim 
und gleich wichtig sind. Zum anderen können die Fragen in ihrer Anordnung im 
Spannungsfeld universitärer Lehre dazu anregen, konkrete Handlungsfelder zu 
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finden und Akteure zu bestimmen, um universitäre Lehre angesichts der KI-Ent- 
wicklung proaktiv zu gestalten. Einige dieser Handlungsfelder und Akteure klingen 
in den oben formulierten Fragen bereits an; wir werden diese im Folgenden ex- 
emplarisch herausgreifen und näher erörtern. Schließlich können die Fragen als 
Impuls verwendet werden, um sie zu erweitern oder zu vertiefen. 


5.1 Curriculare Gestaltung 


Die Hochschuldidaktik konzentriert sich seit Jahrzehnten auf methodische Fragen 
der Gestaltung universitärer Lehre, was zunächst auch nachvollziehbar ist. Hoch- 
schuldidaktik ist eine allgemeine Didaktik, die für alle Disziplinen und Fächer an 
Hochschulen Empfehlungen geben will.'* Curriculare Fragen (solche, die sich auf 
Lehr-Lernziele und -inhalte beziehen) sind dagegen (auch international) eher 
randständig geblieben.” Für die Allgemeine Didaktik (außerhalb der Hochschule) 
war das jedoch keineswegs immer so: Inhaltliche Fragen haben vor allem aus bil- 
dungstheoretischer Perspektive auf Unterricht lange eine zentrale Rolle gespielt.'* 
Uber einen (wiederentdeckten) Diskurs zur Wissenschaftsdidaktik’® rücken derzeit 
allerdings fachspezifische Besonderheiten, Wechselwirkungen zwischen diszipli- 
närer Forschung und Lehre und damit auch Inhalte wieder mehr und systemati- 
scher in den Fokus des hochschuldidaktischen Interesses. Dieses wachsende In- 
teresse trifft nun - zufällig oder nicht - damit zusammen, dass vor allem 
kommerzielle KI-Werkzeuge massiv und mit hoher Geschwindigkeit Einfluss auf die 
wissenschaftliche Forschung ebenso wie auf die Arbeits- bzw. Berufswelt nehmen. 
Das wiederum bewirkt deutliche Veränderungen darauf, was Menschen künftig 
wissen und können sollten, um Forschung betreiben, auf dem Arbeitsmarkt be- 
stehen sowie an der Gesellschaft teilhaben zu können. Derzeit zwingt die KI-Ent- 
wicklung Universitäten geradezu, ihre Curricula inhaltlich zu überarbeiten. Zieht 
man hierzu die Denkfigur vom Spannungsfeld universitärer Lehre heran, rücken 


16 Gabi Reinmann, „Die wissenschaftliche Verortung der Hochschuldidaktik“, in Handbuch Hoch- 
schuldidaktik, hg. von Robert Kordts-Freudinger et al., Bielefeld 2021, 48-49. 

17 Beispiele für hochschuldidaktische Ansätze, die fachwissenschaftliche Inhalte in unterschied- 
licher Form aufgreifen, sind: Threshold Concepts (Jan H.F. Meyer et al., „Threshold concepts and 
troublesome knowledge [4]. Issues of variation and variability.“, in Threshold Concepts within the 
Disciplines, hg. von Ray Land et al., Leiden 2008, 59-74) oder Decoding the Disciplines (David Pace, 
„Beyond decoding the disciplines 1.0: New directions for the paradigm“, Teaching & Learning Inquiry, 
Bd. 9[2], 2021, 1-27). 

18 Z.B. Wolfgang Klafki, Studien zur Bildungstheorie und Didaktik, Weinheim 1963. 

19 Z.B. Gabi Reinmann/Rüdiger Rhein (Hg.), Wissenschaftsdidaktik I. Einführung, Bielefeld 2022; 
Gabe Reinmann/Rüdiger Rhein (Hg.), Wissenschaftsdidaktik II. Einzelne Disziplinen. Bielefeld 2023. 
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mindestens zwei Anforderungen ins Blickfeld: Zum einen ist auf mögliche Span- 
nungsmomente innerhalb neuer Kompetenzanforderungen von Seiten der 
Wissenschaft und der Praxis zu achten; zum anderen dürfen die Person und deren 
persönliche Bildung nicht außen vorgelassen werden. Wir möchten das am Beispiel 
des wissenschaftlichen Schreibens als Ziel und Inhalt von Curricula in aller Kürze 
(und damit nicht erschöpfend) veranschaulichen. 


5.2 Beispiel: Wissenschaftliches Schreiben 


Die neue Generation Textgeneratoren ermöglicht es, beliebige Textgenres künstlich 
zu produzieren - in einer Geschwindigkeit und künftig vermutlich auch in einer 
Qualität, die für den Menschen unerreichbar ist. Aus der Sicht der beruflichen 
Praxis könnte man zu dem Schluss kommen, dass Menschen zur Erstellung von 
Texten vor allem KI-Werkzeuge effektiv nutzen können sollten. In der Folge wäre es 
für Curricula von Studiengängen, die auf Berufe vorbereiten, in denen das der Fall 
ist, wichtiger, beispielsweise Prompting-Kompetenz einzuüben als die Kompetenz 
zum wissenschaftlichen Schreiben. Aus der Sicht der gesellschaftlichen Praxis 
könnte man zu einer ähnlichen Schlussfolgerung kommen und zum Beispiel Ink- 
lusionschancen für Menschen in den Vordergrund rücken, für die aus verschiede- 
nen Gründen eine Schreibkompetenz auf akademischem Niveau unerreichbar ist. 
Nimmt man die Perspektive der Wissenschaft ein, wird man vermutlich feststellen, 
dass sich die Bedeutung von wissenschaftlicher Schreibkompetenz nicht generell, 
sondern nur in Bezug auf einzelne Fachwissenschaften beurteilen lässt - mit he- 
terogenen Folgerungen: So könnten einzelne naturwissenschaftliche Fächer zu 
ähnlichen Einschätzungen wie die berufliche oder die gesellschaftliche Praxis 
kommen und anstelle der Förderung von Schreibkompetenz auf die Förderung der 
Kompetenz zum Einsatz von Sprachmodellen setzen. Andere, etwa geisteswissen- 
schaftliche, Fächer könnten umgekehrt für sich entscheiden, dass wissenschaftli- 
ches Schreiben als Mittel für die Entwicklung von Urteilskompetenz zur Überprü- 
fung künstlich generierter Texte sogar noch wichtiger wird und curricular gestärkt 
werden muss. Aus der Sicht der Person kommt ein weiteres Argument hinzu, das 
unbedingt einzubeziehen wäre (in aktuellen Debatten aber allzu oft gar nicht be- 
rücksichtigt wird): Die Kompetenz, selbst wissenschaftlich schreiben zu können, hat 
gegebenenfalls einen eigenen Wert für einen akademisch gebildeten Menschen 
auch in Zeiten von KI. Anführen könnte man die Bedeutung des Schreibens für das 
Denken, oder wie Luhmann es formuliert hat: „Ohne zu schreiben, kann man nicht 
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denken; jedenfalls nicht in anspruchsvoller, anschlussfahiger Weise“.” Man könnte 
zudem ins Feld führen, dass es zum Menschsein gehört, sich in differenzierter 
Weise ausdrücken zu können, wie man es beim wissenschaftlichen Schreiben lernt. 
Dies wäre gänzlich unabhängig davon, was eine KI alles kann und welche 
Schreibaufgaben sich an KI delegieren lassen. Kame man zu diesem Schluss, dürfte 
man das wissenschaftliche Schreiben keinesfalls curricular einschränken oder gar 
entfernen. Da aber alle drei Pole bei der Gestaltung universitärer Lehre einbezogen 
und in eine Balance zu bringen sind, gilt es, jeweils auszuhandeln, wie man die 
höchst verschiedenen Ansprüche bei der Neuformulierung oder Anpassung von 
Curricula aufeinander abstimmen kann. 


5.3 Methodische Gestaltung 


Dass die KI-Entwicklung Universitäten vor curriculare Herausforderungen stellt 
und damit die Inhaltsfrage wieder prominenter macht, bedeutet im Gegenzug 
keineswegs, dass methodische Fragen der Gestaltung universitärer Lehre weniger 
wichtig werden. Vielmehr ist davon auszugehen, dass KI ebenso wie die bisherige 
Digitalisierung Universitäten herausfordert, die methodische Gestaltung von Lehre 
zu überdenken und zu erneuern. Vergleicht man allerdings, wie Digitalisierung 
bisher zur Lehrgestaltung genutzt wurde mit den aktuellen Nutzungsszenarien (vgl. 
Abschnitt 3), fallen doch einige Unterschiede auf: Bisherige Lernplattformen, 
Videokonferenzsysteme, Blogs, Wikis, soziale Netzwerke, kollaborative Werkzeuge 
etc. haben vor allem zur Gestaltung digitaler und hybrider Lehr-Lernbedingungen 
geführt und damit didaktische Handlungsoptionen im materiellen Raum um die in 
virtuellen Umgebungen erweitert.”* KI-Anwendungen verfolgen im Vergleich dazu 
weitere Ziele und Hoffnungen; zwei Beispiele seien genannt: Zum einen nimmt man 
an, didaktische Aufgaben von Lehrpersonen zunehmend an KI delegieren und au- 
tomatisieren zu können.” Dieses Ziel geht konform mit der Erwartung, Nutzen zu 
maximieren. Zum anderen eignet sich KI dazu, die Passung zwischen Lehrange- 
boten und Merkmalen einzelner Studierender oder Studierenden-Gruppen zu er- 
höhen und durch solche personalisierenden Prozesse bessere Lernerfolge zu er- 
zielen. KI verspricht also Effektivitats- bzw. Wirksamkeitssteigerungen in der Lehre, 


20 Niklas Luhmann, „Kommunikation mit Zettelkästen: Ein Erfahrungsbericht“, in Öffentliche 
Meinung und sozialer Wandel: Public opinion and social change, hg. von Horst Baier et al., Berlin 
1981, 222. 

21 Finat Gil et al., Hybrid learning spaces, Schweiz 2022. 

22 Eva-Maria Schön et al., „How are Al assistants changing higher education?“, in Frontiers in 
Computer Science, Bd. 5, 2023, 1-9 (DOI: 10.3389/fcomp.2023.1208550); Zawacki-Richter et al. 2019, 39. 
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ähnlich wie man es aus der Praxis (zum Beispiel KI zur Nutzenmaximierung), aber 
auch in der wissenschaftlichen Forschung (zum Beispiel KI zur Optimierung von 
Forschungsprozessen) kennt. Zieht man wieder die Denkfigur vom Spannungsfeld 
universitärer Lehre heran, ließe sich folgern: Für die methodische Gestaltung von 
Lehre werden derzeit — teilweise wie in der Praxis und Wissenschaft - KI-An- 
wendungen eingesetzt oder in Erwägung gezogen, um das Lehren und Lernen ef- 
fektiver und wirksamer zu machen. Wenig prominent wird hingegen die Frage 
berücksichtigt, wie das aus der Sicht der Person zu beurteilen ist. Am Beispiel des 
personalisierten Lernens als methodischer Ansatz wollen wir diese Überlegung 
verdeutlichen. 


5.4 Beispiel: Personalisiertes Lernen 


KI-basierte tutorielle und adaptive Systeme ermöglichen es (zumindest im Pilot- 
betrieb und in Zukunftsszenarien), das Lernen Studierender auf den jeweils indi- 
viduellen Bedarf hin auszurichten und auf diesem Wege zu personalisieren.”* Mit 
mafgeschneiderten Lehrangeboten, so die Erwartung, können Studierende 
schneller oder gezielter Kompetenzen entwickeln, werden im Studium produktiver 
und schließen es erfolgreich ab. Das ist aus Sicht der beruflichen und gesell- 
schaftlichen Praxis grundsätzlich begrüßenswert: Mehr Absolventinnen treten zü- 
gig in das Arbeitsleben ein, werden selbständig und geben der Gesellschaft etwas 
zurück - um ein mögliches Argument zu nennen. Auch aus Sicht der Wissenschaft 
ist das Versprechen erst einmal attraktiv, über automatisiertes personalisiertes 
Lernen Entlastungen in der Lehre zu erzielen und zum Studienerfolg beizutragen. 
Es bleibt dank Automatisierung mehr Zeit für die Forschung, komplexe wissen- 
schaftliche Inhalte werden personalisiert gegebenenfalls tiefer verstanden, und 
vielleicht lassen sich auf diesem Wege auch Studierende mit Potenzial für die 
Wissenschaft entdecken. Gleichzeitig wächst aber das Risiko, dass Studierende in- 
folge kontinuierlicher Rückmeldung und automatisierter Beratung zunehmend 
unselbständiger werden, aufhören, eigene Lern- und Arbeitsstrategien sowie 
Selbständigkeit zu entwickeln und zu wenig kritisches Denken und Urteilen erler- 
nen - ein ungünstiges Szenario für alle, auch für die Förderung von Nachwuchs- 
wissenschaftlerinnen. Nochmals spannungsreicher dürfte sich die Situation aus der 
Sicht der Person darstellen: Studierende haben (wie alle Menschen) auf der einen 


23 De Witt et al. 2020; Christian Leineweber/Maik Wunder, „Zum optimierenden Geist der digitalen 
Bildung. Bemerkungen zu adaptiven Lernsystemen als sozio-technische Gefüge“, Zeitschrift für 
Theorie und Praxis der Medienbildung, Bd. 42, 2021, 22-46. 
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Seite das Bedürfnis, rational zu handeln, zu planen und Ziele zu verfolgen (etwa 
einen schnellen Studienabschluss). Auf der anderen Seite sind soziale Eingebun- 
denheit bzw. Zugehörigkeit zu einer Gemeinschaft und soziale Interaktionen (zwi- 
schen Studierenden sowie zwischen Studierenden und Lehrenden) zentrale psy- 
chologische Bedürfnisse und tragen nachweislich ebenfalls zum Studienerfolg bei.”* 
In der Logik adaptiver Lernumgebungen aber sind Studierende vor allem Indivi- 
duen, die sich selbst optimieren, ihre Effizienz steigern und von reibungslosen 
Lernprozessen profitieren.” Gemeinsames Lernen, zwischenmenschliche Bezie- 
hungen, gegenseitige Hilfe auf der Peer Ebene oder emotionale Bindungen werden 
ausgeblendet.” Doch wie viel Maschine verträgt der Mensch?” Diese Frage dürfte 
auch beim Einsatz von KI seitens der Lehrenden relevant sein: Letztlich ist es 
nämlich unklar, was überhaupt zu didaktischen Routineaufgaben zählt und ab 
wann sich Lehrpersonen in ihrem sozial-emotionalen Erleben im Rahmen ihrer 
Lehrtätigkeit eingeschränkt fühlen. Unter Rückgriff auf die Denkfigur vom Span- 
nungsfeld universitärer Lehre stellt die Einführung adaptiver Systeme also weitaus 
mehr und komplexere Anforderungen als Optimierung und Effizienz. Personali- 
siertes, künstlich unterstütztes und entsprechend berechenbares Lernen einerseits 
ist mit interaktivem, beziehungsreichem Lernen in realen Räumen und ihren 
spontanen Momenten des Lehrens und Lernens didaktisch zu integrieren. 


5.5 Akteure der Gestaltung 


Die Gestaltung universitärer Lehre liegt - zumindest auf der Ebene einzelner 
Lehrveranstaltungen — primär in den Händen der Lehrenden. Allerdings hat jedes 
Lehrangebot immer auch organisatorische und rechtliche Rahmenbedingungen, ist 
in die jeweilige Universität als Organisation eingebettet und mit den Fachwissen- 
schaften verknüpft, die einen Studiengang ausmachen. Über Hochschulräte, Ak- 
kreditierungen und Kooperationen wirken zudem Personen aus der beruflichen 
und gesellschaftlichen Praxis an der Gestaltung von Lehre indirekt mit. Wie und 


24 Peter Felten/Leo M. Lambert, Relationship-rich education: How human connections drive success 
in college, Baltimore 2020. 

25 Leineweber/Wunder 2021. 

26 Maik Wunder, „Smarte digitale Technik- bildungstheoretische Reflexion ihrer materiellen und 
symbolischen Operationen“, in Digitale Transformation im Diskurs. Kritische Perspektiven auf 
Entwicklungen und Tendenzen im Zeitalter des Digitalen, hg. von Christian Leineweber/Claudia de 
Witt, Hagen 2021, 293-308. 

27 Siehe dazu eine exemplarische Erläuterung im Blog einer der Autorinnen (Gabi Reinmann), in 
[www.gabi-reinmann.de/?p=7634] (Zugriff: 11.09.2023). 
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was gelernt wird, in welcher Weise gestaltete Lernbedingungen und -angebote 
angenommen und genutzt werden, liegt dann aber in der Hand von Studierenden. 
Universitäre Lehre hat so gesehen grundsätzlich viele Akteure, die (mit)gestalten. 
Führt man sich das Spannungsfeld universitärer Lehre mit ihren drei Polen Praxis, 
Wissenschaft und Person vor Augen, ist naheliegend, dass man sich die Verant- 
wortung in der Gestaltung universitärer Lehre teilen muss. Wenn wir aktuell im 
Zuge der dynamischen Entwicklung von KI zunehmend feststellen, dass Akteure der 
Praxis konkrete Forderungen an die inhaltliche und methodische Gestaltung von 
Lehre stellen, dann ist das also einerseits berechtigt. Andererseits ist unbedingt zu 
vermeiden, dass außeruniversitäre Forderungen den Takt bestimmen, den die Pole 
Wissenschaft und Person unkritisch übernehmen. Nach wie vor sind Mitglieder des 
wissenschaftlichen Personals an Universitäten in ihrer Doppelrolle als Forschende 
und als Lehrende dafür verantwortlich, inhaltliche und methodische Gestaltungs- 
entscheidungen zu treffen. Es wird aber im Zuge der Geschwindigkeit der KI-Ent- 
wicklung mehr denn je darauf ankommen, dass sich Lehrpersonen untereinander 
koordinieren und mit Leitungsebenen abstimmen. Die größte Herausforderung 
aber sehen wir darin, Studierende in einer Form in die Gestaltung universitärer 
Lehre in Zeiten von KI einzubeziehen. In aller Kürze wollen wir das anhand der 
beiden schon herangezogenen Beispiele für die curriculare und methodische Ge- 
staltung von Lehre erörtern. 


5.6 Beispiele: Wissenschaftliches Schreiben und 
personalisiertes Lernen 


Ziele und Inhalte in Curricula einzelner Studiengänge sind nicht statisch: Sie wer- 
den angepasst, verändert, ergänzt oder auch begründet beibehalten. Können Stu- 
dierende einzelne Ziele und Inhalte nicht nachvollziehen, halten sie diese für un- 
wichtig oder gar für Zeitverschwendung, hat dies erhebliche Auswirkungen auf das 
Lernen. Unterschiedliche Einschätzungen dazu, welche Rolle das wissenschaftliche 
Schreiben angesichts immer besser werdender Sprachmodelle in der Textgenerie- 
rung künftig (noch) spielen wird, dürften inzwischen die Regel sein. Genau darüber 
muss man miteinander sprechen: Es wird kein Weg daran vorbeiführen, dass 
Lehrende und Studierende die Gründe ihrer Relevanzeinschätzungen zum wis- 
senschaftlichen Schreiben offenlegen und diskutieren sowie Argumente nach ihrer 
Qualität beurteilen und dahinterstehende Werte transparent machen, auch wenn 
dies mit erheblichem Aufwand verbunden ist. Wenn man in einem Fach zu dem 
begründeten Schluss kommt, dass Studierende nach wie vor lernen sollten, wis- 
senschaftlich zu schreiben, gilt es, Studierende davon zu überzeugen. Nur so ent- 
kommt man der Spirale gegenseitigen Misstrauens etwa bei der Gestaltung 
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dazugehöriger Prüfungen. Sollte man in einigen Fächern zu einer anderen Folge- 
rung kommen, ist mit Studierenden zu klären, welche alternativen Kompetenzen 
erforderlich und zu verantworten sind. 

Auch methodisch ist universitäre Lehre stets in Bewegung. Hier kommt es 
ebenfalls darauf an, dass Studierende (neue) Formate und Formen des Lehrens und 
Lernens in ihrer Sinnhaftigkeit nachvollziehen können, sich darauf einlassen, aber 
auch erkennen, wenn sich Nachteile einstellen. Personalisiertes Lernen als eine KI- 
induzierte Methode in der universitären Lehre ruft bei kritischen Studierenden 
gegebenenfalls Ängste hervor, kontrolliert und von außen gesteuert zu werden. 
Erfolgsorientierte Studierende könnten umgekehrt psychosoziale Risiken übermä- 
Biger Nutzung adaptiver Lernumgebungen unterschätzen. Lehrende selbst haben 
möglicherweise noch wenig Erfahrungen in der Integration personalisierten Ler- 
nens in ihre didaktische Gestaltung und sind ihrerseits verunsichert. Auch hier 
scheint uns eine offene Kommunikation zwischen allen Beteiligten zentral zu sein, 
ergänzt durch Experimentier- und Erfahrungsräume: Man kann sich sinnvoll nur 
darüber austauschen, was man selbst schon einmal erfahren hat. Von daher wäre 
personalisiertes Lernen in möglichst vielen Varianten zu erproben, auszuweiten, 
wo es sich bewährt, aber auch einzuschränken, wo es Schaden anrichtet - möglichst 
begleitet durch einen Diskurs darüber, wieviel Maschine Menschen in der Hoch- 
schullehre vertragen (wollen). 


6 Plädoyer für eine wertebasierte Diskussion 


Die Gestaltung universitärer Lehre in ihrem durch KI beschleunigten und ver- 
stärkten Spannungsfeld hat in vielfacher Hinsicht mit Werten zu tun. Unter Werten 
verstehen wir im gegebenen Zusammenhang (ohne eine bestimmte Werttheorie 
heranzuziehen) implizite oder explizite Überzeugungen, Ideale oder Bedürfnisse, 
die Ausdruck dessen sind, was man für wünschenswert oder erstrebenswert hält, 
und die in der Folge das individuelle und kollektive Handeln beeinflussen. In den 
vorausgegangenen Ausführungen sind an mehreren Stellen Werte in diesem Sinne 
schon angeklungen. Dies ließe sich mit der Denkfigur von Ludwig Huber allerdings 
auch systematischer angehen und über folgende Fragen genauer explorieren. So 
könnte man zunächst die drei Pole im Hinblick auf deren Wertegrundlage be- 
leuchten und unter anderem danach fragen: 
a. Praxis: Welche Werte stehen hinter dem Einsatz von Klin der beruflichen und 
gesellschaftlichen Praxis? 
b. Wissenschaft: Welche Werte sind für den Einsatz von Klin der Wissenschaft an 
sich und in den einzelnen Fachwissenschaften handlungsleitend? 
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c. Person: Welche Werte sind fiir Personen als Individuen und Mitglieder von 
Gemeinschaften zentral, wenn sie auf KI zurückgreifen? 


Zudem ließen sich zum Beispiel die drei Relationen im Hinblick auf Werte disku- 

tieren und dabei nicht nur Problempotenziale in den Blick nehmen, sondern auch 

mögliche Synergiepotenziale — als Brücke von einem Spannungs- zu einem Ge- 
staltungsfeld: 

d. Praxis-Wissenschaft: Inwieweit können wissenschaftliche Werte und solche aus 
der beruflichen und gesellschaftlichen Praxis nicht nur Widersprüche produ- 
zieren, sondern auch komplementär wirken? 

e. Wissenschaft-Person: Inwieweit kann sich die Beziehung zwischen wissen- 
schaftlichen Werten und solchen, die den Menschen ins Zentrum stellen, 
spannungsreich oder synergetisch entwickeln? 

f. Person-Praxis: Inwieweit könnten Werte aus der Praxis von Beruf und Gesell- 
schaft mit solchen kollidieren oder auch harmonieren, die den Menschen ins 
Zentrum stellen? 


Zur Veranschaulichung des Gedankens, mithilfe einer Werte-Diskussion vom 
Spannungs- zum Gestaltungsfeld zu gelangen, ziehen wir abschließend exemplari- 
sche Werte heran und machen diese an typischen Referenzen in den Polen Wis- 
senschaft, Praxis und Person fest. 


Wissenschaft Praxis 


Erkenntnis als Referenz für Pa » 
Werte wie z.B. Nachvoll- ===> 


ziehbarkeit, Begründetheit 


Nutzen als Referenz für 
Werte wie z.B. Wirksam- 
keit, Nachhaltigkeit 


Universitäre 
Lehre 


Person 


Sinn als Referenz für 
Werte wie z.B. 
Verantwortung, 
Wertschätzung 


Abbildung 3: Exemplarische Werte im Spannungsfeld universitärer Lehre. 


So könnte man Erkenntnis als eine mögliche Referenz von Wissenschaft annehmen, 
an der sich - je nach (Sub-)Disziplin unterschiedlich ausgeprägt — verschiedene 
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Standards festmachen, welche als Werte innerhalb wissenschaftlicher Gemein- 
schaften fungieren. Beispielhaft ließen sich Nachvollziehbarkeit und Begründetheit 
wissenschaftlichen Handelns nennen. 

Nutzen wäre eine denkbare Referenz von Praxis, an der sich (wiederum un- 
terschiedlich je nach beruflicher oder gesellschaftlicher Praxis) handlungsleitende 
Normen oder Werte wie etwa Wirksamkeit oder Nachhaltigkeit (als Beispiele aus 
vielen weiteren Möglichkeiten) andocken lassen. Schließlich ließe sich Sinn als eine 
Referenz für die Person verwenden und darunter etwa Verantwortung (was freie 
Entscheidungen voraussetzt) und Wertschätzung (durch andere) subsumieren. Hat 
man solche (oder andere) Werte expliziert, kann man nicht nur nach potenziellen 
Spannungen in Form von Konflikten, Widersprüchen oder Konkurrenzen zwischen 
verschiedenen Werten an den Polen Wissenschaft, Praxis und Person suchen. Man 
könnte auch nach Synergien Ausschau halten: Inwieweit wäre es möglich, KI zur 
Gestaltung universitärer Lehre einzusetzen, die wissenschaftlich begründet ist und 
von Personen verantwortet werden kann? Wie könnte man KI zur Gestaltung 
universitärer Lehre so heranziehen, dass sie praktisch wirksam wird und auf 
wissenschaftlich nachvollziehbarem Wissen beruht? Was ist zu tun, um bei der 
Nutzung von Klin der universitären Lehre sowohl Wertschätzung von Personen als 
auch die Nachhaltigkeit für die Praxis sicherzustellen? 

Klar ist allerdings auch, dass die Denkfigur des Spannungsfelds universitärer 
Lehre inklusive einer wertebasierten Diskussion Mehrdeutigkeit und Pluralität 
erzeugen und damit eindeutige und homogene Zukunftsszenarien für die univer- 
sitäre Lehre mit KI nahezu unmöglich machen. Genau dies aber scheint uns im 
akademischen Diskurs unabdingbar zu sein. 


Ulrike Aumüller/Maximilian Behrens/Colin Kavanagh/Dennis 
Przytarski/Doris Weßels 


Mit generativen KI-Systemen auf dem Weg 
zum Human-Al Hybrid in Forschung und 
Lehre 


Abstract: This paper explores the evolving landscape of generative artificial intel- 
ligence (AI) systems, emphasizing their transformative potential in research and 
education. The discourse begins with an examination of AI language models, par- 
ticularly focusing on the characteristics and evolution of ChatGPT. It then transi- 
tions into discussing AI writing assistants, probing their omnipresence and ubi- 
quitous technology status. A significant portion is dedicated to analyzing the concept 
of truth in the AI era, analyzing the blurred line between facts and fiction as in- 
fluenced by AI technologies. The narrative advances to the concept of Human-AI 
Hybrid, investigating both the opportunities and risks it presents for scientific 
discourse. The document encapsulates with conclusions and an outlook on the is- 
sues discussed, paving the way for further discussion and investigation into the 
harmonization of human intelligence and artificial counterparts in academia. By 
comprehensively exploring these issues, the document contributes to the broader 
conversation about the integration and ethical implications of AI in research and 
educational settings. 


1 Einleitung 


Im September 2023 veröffentlichte die Deutsche Forschungsgemeinschaft (DFG) 
eine Stellungnahme „zum Einfluss generativer Modelle für die Text- und Bilder- 
stellung auf die Wissenschaften und das Förderhandeln“,' in der es heißt: 


Schon jetzt verändern KI-Technologien den gesamten wissenschaftlichen, erkenntnisgewin- 
nenden und kreativen Arbeitsprozess in vielfältiger Weise und werden in den verschiedenen 
Wissenschaftsbereichen unterschiedlich eingesetzt. Diese Entwicklung steht bezüglich der 


1 Vgl. Deutsche Forschungsgemeinschaft, Stellungnahme des Präsidiums der Deutschen For- 
schungsgemeinschaft (DFG) zum Einfluss generativer Modelle für die Text- und Bilderstellung auf die 
Wissenschaften und das Förderhandeln der DFG, 2023, in [dfg.de/download/pdf/dfg_im_profil/ge- 
schaeftsstelle/publikationen/stellungnahmen_papiere/2023/230921_stellungnahme_praesidi- 
um_ki_ai.pdf] (Zugriff: 22.09.2023). 


8 Open Access. © 2024 bei den Autorinnen und Autoren, publiziert von De Gruyter. Dieses Werk ist 
lizenziert unter einer Creative Commons Namensnennung - Nicht kommerziell - Keine Bearbeitung 4.0 International 
Lizenz. https:/doi.org/10.1515/9783111351490-005 
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generativen Modelle für die Text- und Bilderstellung [...] jedoch erst am Anfang, sodass es einer 
begleitenden Analyse und Bewertung bedarf, um die entsprechenden Chancen und möglichen 
Risiken abzuschätzen. 


Diese Stellungnahme zeigt einerseits, dass es großen Bedarf an Leitlinien zum 
Umgang mit KI im wissenschaftlichen Kontext gibt, und andererseits, dass die 
Diskussion um die Entwicklung der entsprechenden wissenschaftlichen Regeln 
aufgrund der dynamischen Entwicklung der KI-Technologien nur parallel bzw. 
nachgelagert erfolgen kann. Währenddessen setzen Lehrende und Studierende KI 
auch mit Blick auf die künftige Stellung dieser im Bereich der Wissenschaft schon in 
ihrem Alltag ein, sehen aber viele Eigenschaften der generativen KI noch kritisch.” 

Es scheint insofern naheliegend, dass die Auswirkungen von KI auf wissen- 
schaftliches Arbeiten kontrovers diskutiert werden und der Frage nachgegangen 
wird, inwiefern sich wissenschaftliches Arbeiten und auch die Arbeit der Wissen- 
schaftler:innen zukünftig ändern könnten. In diesem Beitrag soll ein Teilaspekt 
dieser Diskussion und Untersuchungen betrachtet werden, nämlich wie die Arbeit 
als ,Human-Al Hybrid“ in Forschung und Lehre konkret aussehen könnte. Es wird 
also untersucht, wie die Kollaboration zwischen Mensch und Maschine beim aka- 
demischen Schreiben künftig gestaltet werden könnte. Es werden Vor- und Nach- 
teile dieser hybriden Arbeitsform und Konsequenzen für z. B. die Integrität wis- 
senschaftlicher Texte aufgezeigt. Hierbei liegt der Fokus auf Text generierenden 
Modellen. 

Um den oben aufgeführten Fragen nachzugehen, werden zunächst die Cha- 
rakteristika von KI-Sprachmodellen und Entwicklungen in der Mensch-Sprachmo- 
dell-Interaktion rund um das Modell ChatGPT grundlegend erläutert. In Bezug auf 
diese werden grundsätzliche Potenziale aber auch Risiken aufgezeigt. Im nächsten 
Schritt wird dieses Thema im Zusammenhang des wissenschaftlichen Arbeitens 
konkretisiert und Chancen und Risiken der Modelle präsentiert, wobei es sowohl 
um Einsatzmöglichkeiten und ethische Fragestellungen als auch um die Qualität 
und Integrität wissenschaftlicher Texte geht. Anschließend wenden sich die Autor: 
innen konkret dem Wahrheitsbegriff zu bzw. ob und wie dieser sich durch Ver- 
wendung von KI im wissenschaftlichen Kontext verändern und verschieben könnte. 
Daraufhin wird aufgezeigt, welche unterschiedlichen Formen des ,Human-AI 
Hybrids“ sich beim wissenschaftlichen Arbeiten ausformen und welche Heraus- 
forderungen aber auch Chancen jeweils damit verbunden sein könnten. Ein be- 
sonderes Augenmerk fällt dabei auf die Entwicklung der Rolle von Wissenschaftler: 
innen innerhalb dieses Hybrids. Am Ende des Textes werden die Ergebnisse zu- 


2 Vgl. Forschung und Lehre, „So setzen Lehrende KI im Hochschulalltag ein“, 2023, in [forschung- 
und-lehre.de/management/wie-funktioniert-ki-im-hochschulalltag-5873] (Zugriff: 22.09.2023). 
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sammengefasst, Forschungslücken aufgezeigt und konkrete Handlungsempfehlun- 
gen für die wissenschaftliche Praxis formuliert. 


2 KI-Sprachmodelle: Technische Charakteristika 
sowie Entwicklung Mensch-Sprachmodell- 
Interaktion am Beispiel von ChatGPT 


Generative KI-Systeme sind eine spezialisierte Form von Systemen im Definitions- 
bereich „Künstliche Intelligenz“, deren Ziel die Erzeugung neuer Daten ist, die be- 
stehenden Datensätzen ähnlich sind. Solche Systeme nutzen neuronale Netzwerke, 
die auf die Identifikation von Mustern und Beziehungen innerhalb eines gegebenen 
Datensatzes trainiert sind. Ein prominentes Beispiel für generative KI-Modelle sind 
Large Language Models (LLMs). Im Folgenden soll auf grundlegende Charakteris- 
tika in Sprachmodellen am Beispiel der GPT-Modelle von OpenAl eingegangen 
werden, die u. a. in der Anwendung ChatGPT zum Einsatz kommen.’ Die Abkürzung 
GPT steht für Generative Pre-trained Transformer, was auf die zugrundeliegende 
Architektur des Modells hinweist. In der Transformer-Architektur ist ein Schlüs- 
selmerkmal die Fähigkeit zur Kontextgewichtung, die es dem Modell ermöglicht, die 
Bedeutung von Wörtern im Kontext einer gegebenen Eingabesequenz zu erfassen 
und mit wenig Eingaben oder keinen Vorgaben bereits einen Text ausgeben zu 
können.* 

Dafür wird jeder Begriff in der Eingabesequenz mit jedem anderen Begriff in 
Beziehung gesetzt, ein Prozess, der u. a. als „Self-Attention“ bekannt ist. Der Ein- 
gabetext wird in diskrete Einheiten, sogenannte Tokens, zerlegt. Diese Tokens 
werden in der Folge durch die Schichten der Transformer-Architektur geleitet. 
Während dieses Durchlaufs werden den Tokens Gewichtungen zugeordnet, die im 
Kontext der gesamten Eingabesequenz stehen. Die Gewichtungen steuern den 
Beitrag jedes Tokens zur endgültigen Ausgabe des Modells und werden durch den 
Trainingsprozess erlernt und sind das Ergebnis der Optimierung einer bestimmten 
Zielfunktion, meist einer Form der Fehler- und Kostenminimierung. Das Konzept 
der „Aufmerksamkeit“ in diesen Modellen ist daher strikt mathematisch und un- 
terstreicht die inhärente stochastische Unsicherheit und Varianz im Modellver- 
halten, die sowohl für die Interpretation der Modellausgabe als auch für die 


3 OpenAl, Introducing ChatGPT, 2022, in [openai.com/blog/chatgpt] (Zugriff: 30.09.2023). 
4 Vgl. Ashish Vaswani et al., Attention is All You Need, ArXiv 2017, in [wwwarxiv.org/abs/1706.03762 
oder https:/doi.org/10.48550/arXiv.1706.03762] (Zugriff: 30.09.2023). 
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Überprüfung der Modellzuverlässigkeit von Bedeutung sind. Insbesondere bei der 
Interaktion mit Sprachmodellen ist die Generierung gesteuert durch eine Textein- 
gabe, wobei die Antworten des Modells auf einem komplexen Zusammenspiel 
zwischen den trainierten Parametern und dem gegebenen Prompt (Texteingabe) 
basieren. Aus dieser Kombination heraus generieren LLMs einzigartigen Text- 
kombinationen, die sich nicht oder sehr selten, bis auf gewisse Formulierungs- oder 
Tonalitätsmuster, wiederholen. Im wissenschaftlichen Kontext führt dies dazu, dass 
die generierten Unikate nicht oder schwieriger als Plagiate klassifiziert werden 
können. Anwendungen wie ChatGPT dienen somit nicht als verlässliche Suchma- 
schine aus einer Datenbank an Wissen, sondern fungieren als Inspirations- und 
Imitationsmaschine, die auf Nutzer:innen-Eingaben mit generierten Texten reagiert 
und somit bei der Erstellung von wissenschaftlichen Artikeln durch eine Wir- 
kungssynthese aus menschlichem Input und trainiertem Sprachmodell helfen kann. 

Ein kritisches Element in der Entwicklung und Anwendung generativer KI- 
Modelle ist der inhärente Bias der Trainingsdaten. Die umfangreichen Datensätze 
können menschliche Vorurteile reflektieren und somit zu diskriminierenden 
Textausgaben führen, die Rassismus, Sexismus oder Ableismus beinhalten.° Zudem 
verfügen LLMs aufgrund ihrer stochastischen Natur über keinen Zugang zu einem 
bewussten Verständnis des Kontexts. Es ist davon auszugehen, dass Textausgaben 
daher „Halluzinationen“, also Falschinformationen, enthalten können.’ Um diesen 
Phänomenen entgegenzuwirken, hat OpenAl in der Entwicklung der Modell-Ver- 
sion GPT3.5 das Verfahren des „Reinforcement Learning from Human Feedback“ 
(RLHF) angewendet. Dabei wurden die Antworten des KI-Modells von menschlichen 
Bewerter:innen evaluiert. Sicherheitsgefährdende, hasserfüllte oder stereotypische 
Inhalte wurden negativ und demgegenüber sichere, unbedenkliche Inhalte positiv 
bewertet. Was als bedenklich, wünschenswert oder sicherheitsgefährdend bewertet 
wird, unterliegt einer unbekannten Interpretation von OpenAl und deren Mitar- 
beitenden, die die Ausgaben beurteilten. Im Zuge der Weiterentwicklung durch das 
RLHF-Training bewertete OpenAI die Ausgaben des KI-Modells als „sicher“ genug 
an, um die Anwendung ChatGPT am 30. November 2022 mit einer auf eine Chat- 
Interaktion feingetunten Version von GPT 3.5 zu veröffentlichen.® Es ist jedoch 
wichtig zu betonen, dass der RLHF-Ansatz die vorhandenen Vorurteile und Hallu- 


5 Vgl. Tom Brown et al., Language Models are Few-Shot Learners, ArXiv 2020, in [https://arxiv.org/ 
abs/2005.14165] (Zugriff: 30.09.2023). 

6 Vgl. Emily Bender et al., „On the Dangers of Stochastic Parrots: Can Language Models Be Too Big?“, 
FAccT ’21: Proceedings of the 2021 ACM Conference on Fairness, Accountability and Transparency, 
2021, 610-623, in [www.doi.org/10.1145/3442188.3445922] (Zugriff: 20.09.2023). 

7 Vgl. Brown et al. 2020. 

8 Vgl. OpenAl 2022. 
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zinationen nicht eliminiert. Stattdessen wird der im Datensatz enthaltene Bias und 

die Ausgabe von Falschinformationen lediglich durch Änderungen in den Gewich- 

tungen nur grundlegend maskiert.’ 

Zudem kann die Diffusion von LLMs als Werkzeug und Methode hinein in die 
Gesellschaft zu diversen Auswirkungen führen. Weidinger et al. entwickelten 
hierzu in ihrem Paper „Taxonomy of Risks posed by Language Models“ eine um- 
fassende Übersicht ethischer und sozialer Risiken, die sie in sechs übergeordnete 
Bereiche einteilen.’ Diese Bereiche sind: 

- Diskriminierung, Hassrede und Exklusion: LLMs können, wie bereits er- 
wähnt, unbeabsichtigt diskriminierende, hasserfüllte oder exklusive Sprache 
verwenden, da sie auf Datensätzen trainiert werden, die menschliche Vorein- 
genommenheit enthalten. Dies ist insbesondere im wissenschaftlichen Kontext 
problematisch und kann marginalisierte Gruppen weiter benachteiligen. 
Hierbei können empirische Studien hilfreich sein, um das Problem in seiner 
Tiefe und Breite zu beleuchten. 

— Informationsgefahren (im Sinne von Datenlecks): Es besteht die Möglich- 
keit, dass ein LLM vertrauliche Informationen, die in den Trainingsdaten ent- 
halten waren, preisgibt. Obwohl die Modelle keine spezifischen Daten „erin- 
nern“, können sie dennoch Informationen generieren, die als sensitiv 
betrachtet werden könnten. Wissenschaftliche Abhandlungen können eine 
gründliche Untersuchung der Architektur und der Trainingsdaten von LLMs 
beinhalten, um potenzielle Risiken für Datenlecks zu bewerten. Methoden zur 
Anonymisierung und Datenbereinigung können ebenfalls diskutiert werden. 

- Schädigung durch Desinformation: LLMs können falsche oder irreführende 
Informationen verbreiten, sei es durch Fehler im Modell oder durch Manipu- 
lation von außen. Diese Desinformation kann schwerwiegende Folgen haben, 
insbesondere wenn sie in kritischen Bereichen wie der Gesundheitsversorgung 
oder der Politik eingesetzt wird. 

-  Böswillige Nutzung: Die Technologie kann für schädliche Zwecke, wie die 
Erstellung von Deepfakes oder die Automatisierung von Hassreden, miss- 
braucht werden. Im Zuge des wissenschaftlichen Gebrauchs von Sprachmo- 
dellen können mögliche Missbrauchsszenarien skizziert werden, einschließlich 
der ethischen und rechtlichen Rahmenbedingungen, die eine böswillige Nut- 
zung einschränken könnten. 


9 Vgl. Phillipp Schönthaler, „Schneller als gedacht - ChatGPT zwischen wirtschaftlicher Effizienz 
und menschlichem Wunschdenken“, Heise Magazin c’t, Heft 9, 2023, 126-131. 

10 Vgl. Laura Weidinger et al., „Taxonomy of Risks posed by Language Models“, FAccT ’22: Pro- 
ceedings of the 2022 ACM Conference on Fairness, Accountability and Transparency, 2022, 214-229, in 
[dl.acm.org/doi/10.1145/3531146.3533088] (Zugriff: 30.09.2023). 
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- Gefährdung durch die Mensch-Computer-Interaktion („Anthropo- 
morphisierung‘“): Die Fähigkeit von LLMs, menschenähnliche Texte zu gene- 
rieren, kann dazu führen, dass Benutzer:innen sie als menschenähnliche We- 
sen wahrnehmen. Dies kann problematisch sein, wenn Benutzer:innen den 
Maschinen ein Maß an Vertrauen oder Verantwortung zuschreiben, das sie 
nicht verdienen. 

— Umweltgefahrdung und negative sozioökonomische Auswirkungen: Der 
Betrieb großer Modelle erfordert erhebliche Rechenressourcen, was negative 
Auswirkungen auf die Umwelt haben kann. Zudem könnten Arbeitsplätze, auch 
im wissenschaftlichen Betrieb, durch Automatisierung verloren gehen, was zu 
sozioökonomischen Herausforderungen führen kann. 


Weiterhin bietet die Chronologie der Entwicklung von ChatGPT von November 2022 
bis September 2023 Einblicke in die zunehmende Komplexität der Mensch- 
Sprachmodell-Interaktion und ihre potenziellen Auswirkungen auf das wissen- 
schaftliche Schreiben. Ursprünglich als einfache Benutzer:innenoberfläche konzi- 
piert, die direkten Zugang zum Sprachmodell ermöglichte, hat ChatGPT im Laufe 
der Zeit mehrere Erweiterungen erfahren. Die Einführung von sogenannten „Plu- 
gins“ im März 2023 erweiterte die Funktionalität des Systems erheblich." Insbe- 
sondere die Implementierung eines Web-Browsing-Plugins und eines Code Inter- 
preters hat die Möglichkeiten für die wissenschaftliche Forschung ausgebaut. Das 
Web-Browsing-Plugin ermöglicht es, aktuelle Informationen direkt in wissen- 
schaftliche Arbeiten einzufügen, während der Code Interpreter die Ausführung von 
Python-Code in einer System-Umgebung ermöglicht, was für Datenanalysen und 
-visualisierungen nützlich sein könnte. Die Zuverlässigkeit und Transparenz der aus 
dem Internet abgerufenen Informationen und die möglichen Datenschutzrisiken 
sind jedoch Faktoren, die sorgfältig bewertet werden müssen. 

Ebenso können die im August 2023 eingeführten „Custom Instructions“ die 
Möglichkeit bieten, die Modellausgaben genauer zu steuern, was eine zielgerichtete 
Erstellung wissenschaftlicher Texte ermöglichen könnte.'” Custom Instructions sind 
eine Funktion von ChatGPT, die es den Benutzer:innen ermöglicht, spezifische 
Anweisungen oder Präferenzen für die Generierung von Antworten durch das 
Modell festzulegen. Sobald diese Anweisungen gesetzt sind, berücksichtigt das 
Modell sie in allen zukünftigen Konversationen, sodass der Benutzer nicht bei je- 
dem Dialog seine Präferenzen erneut äußern muss. Diese Funktion erhöht die 


11 Vgl. OpenAI, ChatGPT Plugins, 2023a, in [openai.com/blog/chatgpt-plugins] (Zugriff: 30.09.2023). 
12 Vgl. OpenAl, Custon Instructions for ChatGPT, 2023b, in [openai.com/blog/custom-instructions- 
for-chatgpt] (Zugriff: 30.09.2023). 
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Steuerbarkeit des Modells und ermöglicht eine bessere Anpassung an die indivi- 
duellen Bedürfnisse und Kontexte der Benutzer:innen. Ein Beispiel könnte die Er- 
stellung von Forschungssynthesen sein. Ein:e Forscher:in könnte die Anweisung 
geben: „Bei der Zusammenfassung von Forschungsergebnissen strukturiere die 
Informationen nach der PICOS-Methode (Patienten, Intervention, Vergleich, Er- 
gebnis, Studiendesign).“ Dies würde dem Modell eine klare Richtlinie bieten, wie 
Forschungsergebnisse in einer systematischen und standardisierten Weise prä- 
sentiert werden sollten, was insbesondere für wissenschaftliche Reviews oder 
Meta-Analysen nützlich sein kann. 


3 KI-Schreibassistenten: Omniprasente und 
ubiquitäre Technologie? 


Mithilfe der Plattform „Advanced Innovation“ wurde im August 2023 eine Suche 
nach Text generierenden KI-Tools durchgeführt. Hierzu wurde in der Suchmaske 
für KI-Tools die Auswahl „Text-Erstellung“ gewählt. Diese beispielhafte Suche 
brachte 303 verschiedene Tools hervor, die zu diesem Zwecke dienen.'? Diese si- 
cherlich nicht vollständige Zahl und Auflistung zeigen, wie umfassend die Auswahl 
an KI-Anwendungen zum Zwecke der Textgenerierung ist. Die Quantität allein lässt 
jedoch natürlich noch keine Angaben zur Qualität der generierten Texte zu. Den 
Fragen danach, welche Potenziale die Tools tatsächlich aufweisen und welche 
Herausforderungen und Gefahren eventuell auch mit dem Umgang dieser beim 
wissenschaftlichen Arbeiten im Speziellen verbunden sind, wird im Folgenden 
nachgegangen. 

Mittels mehrerer „KI-Schreibwerkstätten“ ergründeten Doris Weßels und Mo- 
ritz Larsen gemeinsam mit Studierenden die Potenziale und Grenzen von KI-Text- 
generatoren beim akademischen Schreiben. Beispielhaft wird hier auf die KI- 
Schreibwerkstatt vom 3. Mai 2023 eingegangen. An dem Workshop nahmen 27 
Studierende aus verschiedenen Fachbereichen teil. Das Ziel der Veranstaltung war 
es, grundlegend die Funktionsweise von KI-Textgeneratoren zu verstehen, sowie 
diese in Praxisphasen anwenden zu lernen. Im Anschluss erfolgte eine Reflexion 
der Studierenden zur Nutzung der unterschiedlichen Anwendungen. Diese wurde 
mit den Fragen eingeleitet: 

— Was hat am meisten Spaß gemacht? 
— Wo lagen die größten Schwierigkeiten? 


13 Vgl. Advanced Innovation, KI Tools, 2023, in [advanced-innovation.io/ki-tools] (Zugriff: 12.08. 
2023). 
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— Was empfiehlst du anderen Studierenden? 
- Was wünscht du dir von den Lehrenden? 


Zur Frage nach den größten Schwierigkeiten nannten die Studierenden einige Li- 
mitierungen und Herausforderungen, die ihnen bei der Arbeit mit den generativen 
KI-Tools aufgefallen sind: 
„KI-Tools können zu einer Abhängigkeit führen und die menschliche Schreib- 
fähigkeit beeinträchtigen.“ 

- „Sie können nicht immer korrekte oder vollständige Texte generieren, was eine 
zusätzliche Überprüfung/Recherche erforderlich macht.“ 

— „Herausforderungen können bei der Anpassung von Formulierungen, der 
Kontextualisierung von Textabschnitten und der Vermeidung von Textdupli- 
katen auftreten. Dies kann mit Frustration verbunden sein.“ 

- „Sie sind nicht immer geeignet für die Erstellung bestimmter Textarten.“ 


Die erste Aussage zur Beeinträchtigung menschlicher Schreibfähigkeit deckt sich 
mit der Befürchtung vieler Lehrender. Spannagel zeigt in seinem Blogbeitrag hierzu 
unterschiedliche Ansätze auf. Einer davon besagt, dass, wenn eine Kompetenz 
durch einen Lehrenden als essenziell erkannt wird, die Notwendigkeit auch von den 
Lernenden erkannt werden müsse. Wenn also das Schreiben akademischer Texte 
als eine wichtige Kompetenz angesehen wird, müssen die Lernenden zu dieser 
Erkenntnis geführt bzw. davon überzeugt werden.'* Die zweite Aussage scheint vor 
dem Hintergrund der bereits in Abschnitt 2 aufgezeigten Risiken eine unstrittige 
Feststellung zu sein. Im Folgenden wird hierauf auch noch weiter eingegangen in 
Bezug auf eine sinnvolle Aufteilung von Arbeitsschritten zwischen KI und Mensch 
beim akademischen Schreiben. 

Zu der ersten Frage „Was hat am meisten Spaß gemacht?“ äußerten sich die 
Studierenden u. a. mit folgenden Hinweisen auf verschiedene Vorteile und Nutzen: 
-  „KI-Tools bieten direkte, vielfältige und kreative Antworten.“ 

- „Sie fördern das kreative Arbeiten und machen den Schreibprozess ‚amüsan- 
ter‘.“ 

— ,Angenehme Interaktion durch das Chat-Interface.“ 

- „Sie unterstützen bei der Texterstellung durch schnelle und qualitativ hoch- 
wertige Ergebnisse.“ 

— „Sie fördern die Effizienz durch Zeitersparnis.“ 


14 Vgl. Christian Spannagel, „ChatGPT und die Zukunft des Lernens: Evolution statt Revolution“, 
Hochschulforum Digitalisierung, 2023, in [https:/hochschulforumdigitalisierung.de/de/blog/chatgpt- 
und-die-zukunft-des-lernens-evolution-statt-revolution] (Zugriff: 30.09.2023). 
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Es gab weitere ähnliche Hinweise zu Effizienzsteigerung, Hilfe bei der Ideengene- 
rierung und mehr Freude beim Arbeiten. 

Die Eindrücke der Studierenden decken sich auch mit den Ergebnissen einer 
MIT-Studie aus Juli 2023, die in einem beruflichen Kontext durchgeführt wurde."® 
Diese zeigte, dass sich die Zeit, die die Arbeitnehmer:innen für die Erledigung der 
ihnen gestellten Aufgaben benötigten, durch den Zugriff auf den unterstützenden 
Chatbot ChatGPT um 40 Prozent verringerte. Die Qualität der Ergebnisse stieg laut 
Aussage der Autor:innen derweil um 18 Prozent. Auch die Auswertungen einer 
experimentellen Studie, die in Kooperation mit der Boston Consulting Group ent- 
standen ist, zeigten, dass Mitarbeitende mit Zugriff auf ChatGPT unter Verwendung 
des GPT-4-Modells die ihnen zugewiesenen Aufgaben nicht nur schneller, sondern 
auch in höherer Qualität erledigten als Kolleg:innen, die keinen KI-Zugriff hatten. 
Dies allerdings unter der Voraussetzung, dass zwar komplexe, realistische Aufgaben 
ausgewählt wurden, diese 18 unterschiedlichen Aufgaben sich aber auch im Kor- 
ridor des momentan für KI Leistbaren bewegten.'® 

Die Effekte der Qualitätssteigerung als auch der Produktivitätszunahme, die 
sowohl beim akademischen Schreiben wahrgenommen als auch im beruflichen 
Kontext von Akademiker:innen aufgezeigt wurden, mögen eine Erklärung dafür 
sein, dass auch wissenschaftliche Suchmaschinen und Verlage die KI-Textgenera- 
toren reagieren und z. B. KI-gestützte, dialogorientierte wissenschaftliche Suche 
anbieten.“ 

Konkrete praktische Anwendungshinweise zu KI-Nutzung beim wissenschaft- 
lichen Arbeiten finden sich in einem Arbeitsblatt des Schreibzentrums der Goethe- 
Universität, das im Mai 2023 veröffentlicht wurde.** Hierin wird eine „plausible 
Aufteilung menschlicher und KI-Textproduktion beim akademischen Schreiben“ 
aufgezeigt. Konkret wird hier darauf eingegangen, bei welchen Aufgaben KI-Sys- 
teme konkret unterstützend wirken können und welche unerlässlich durch Men- 
schen ausgeführt werden sollten. Der Schreibprozess unterteilt sich demnach in 
fünf Phasen, von der „Findungsphase“ über die „Datenerhebungs-/Bearbeitungs- 


15 Vgl. Shakked Noy/Whitney Zhang, „Experimental evidence on the productivity effects of gene- 
rative artificial intelligence“, Science, Bd. 381(6654), 2023, 187-192. 

16 Vgl. Fabrizio Dell’Acqua et al., Navigating the Jagged Technological Frontier: Field Experimental 
Evidence of the Effects of AI on Knowledge Worker Productivity and Quality, Harvard Business School 
Technology & Operations Mgt. Unit Working, Paper No. 24-013, in [ssrn.com/abstract=4573321] 
(Zugriff: 28.09.2023). 

17 Vgl. Richard Van Noorden, „ChatGPT-like Als are coming to major science search engines“, Na- 
ture, Bd. 620(7973), 2023, 258, in [nature.com/articles/d41586-023-02470-3] (Zugriff: 12.08.2023). 

18 Vgl. Schreibzentrum der Goethe-Universitat Frankfurt a. M., Nutzung von KI-Schreibtools durch 
Studierende, 2023, in [https:/wwwstarkerstart.uni-frankfurt.de/133460941/6-030_KI-Tools_pdf.pdf] 
(Zugriff: 20.09.2023). 
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phase“, die „Formulierungsphase“ und die „Überarbeitungsphase“ bis hin zur 
„Fertigstellungsphase“. In der „Formulierungsphase“ beispielsweise können KI- 
Systeme zur „Ausformulierung von Stichpunkten“ oder der „Weiterentwicklung von 
Textfragmenten“ genutzt werden, während die Grundlagen hierfür aber vom 
Menschen selbst formuliert werden sollten, ebenso wie die Beurteilung und Wei- 
terentwicklung des generierten Outputs als menschliche Handlung verbleiben 
sollten. 

Die Beurteilung der Qualität des Outputs ist deshalb von besonderer Relevanz, 
da wie bei KI-basierten Suchmaschinen auch, nach wie vor Halluzinationen auf- 
treten könnten.’ 

Die Schwierigkeit im Umgang mit Halluzinationen ist eine der zentralen Her- 
ausforderungen und Diskussionspunkte rund um den Zusammenhang von gene- 
rativer KI und wissenschaftlichem Arbeiten. Deshalb wird im kommenden Ab- 
schnitt das Thema der Wahrheit im Zeitalter von KI genauer beleuchtet. 


4 Wahrheit im Zeitalter von KI: 
Herausforderungen und Perspektiven 


In einer Zeit, in der KI-Systeme zunehmend in der Lage sind, Informationen zu 
generieren, zu verarbeiten und zu verbreiten, drängt sich die Frage auf, wie 
Wahrheit in diesem digitalen Zeitalter definiert und erkannt werden kann. Um 
dieses komplexe und faszinierende Thema zu beleuchten, wird in diesem Beitrag 
der Wahrheitsbegriff des Soziologen Niklas Luhmann genauer betrachtet und in 
den Kontext einer sich anbahnenden „Infocalypse“”° durch Künstliche Intelligenz 
gestellt. Luhmanns Denken über die soziale Konstruktion von Wahrheit bietet eine 
weitreichende theoretische Grundlage, um die Auswirkungen von KI-Anwendungen 
auf das gesellschaftliche Verständnis von Wahrheit zu erforschen. Zugleich ist die 
„Infocalypse“ eine vermeintlich ernsthafte Bedrohung für die Verarbeitung und 
Verbreitung von Informationen, da sie das Vertrauen in die Wahrheit und Integrität 
von Informationen gefährden könnte. 

Der Ausdruck „Reality Apathy“ beschreibt das Phänomen des beinahe voll- 
ständigen Desinteresses an Ereignissen und Informationen, die außerhalb der ei- 
genen Lebenswelt oder persönlichen Erfahrungssphäre stattfinden. Dieses Desin- 
teresse wird durch die zunehmende Schwierigkeit verstärkt, zwischen echten und 


19 Ebd. 
20 Vgl. Aviv Ovadya, „The Terrifying Future of Fake News“, Buzzfeed News, 2023, in [buzzfeed- 
news.com/article/charliewarzel/the-terrifying-future-of-fake-news] (Zugriff: 21.09.2023). 
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gefälschten Informationen zu unterscheiden. In einer Welt, in der die Verbreitung 
von Fehlinformationen und gefälschten Inhalten rapide zunimmt, verlieren die 
Menschen das Vertrauen in Nachrichten und Informationen, was zu einer Art 
Gleichgültigkeit gegenüber der Realität führt.” 

Die Konsequenzen dieses Phänomens können die Grundlagen einer funktio- 
nalen Demokratie, wie ein informiertes Bürgertum und eine fundierte Nachrich- 
tenberichterstattung, potenziell untergraben. Wenn die Menschen aufhören, 
Nachrichten und Informationen aufmerksam zu verfolgen, kann dies die Stabilität 
der Gesellschaft gefährden und zu einer verstärkten Fragmentierung führen.” 
Luhmann betont, dass die Suche nach Wahrheit nicht die Hauptaufgabe des Me- 
diensystems ist. Das bedeutet, dass Medien nicht primär dazu da sind, absolute 
Wahrheiten zu vermitteln.” Journalisten wählen aus einer Vielzahl von Fakten, 
Ereignissen und Quellen aus, um eine Geschichte zu erstellen. Diese Auswahl und 
Darstellung erfolgt nach bestimmten Kriterien wie Aktualität, Relevanz, Dramatik 
und Leseinteresse. Journalistische Erkenntnis ist daher nach Luhmann eine Art 
Filterung und Verdichtung von Erkenntnissen, die oft stark von den Zielsetzungen 
des Mediums und den Erwartungen des Publikums beeinflusst werden. Konträr 
zum Journalismus arbeitet die Wissenschaft nach dem Prinzip von wahr/unwahr, 
wodurch die Suche nach Wahrheit als zentrale Aufgabe wissenschaftlicher Kom- 
munikation gekennzeichnet ist.”* Dieser Code steht jedoch in deutlichem Kontrast 
zum Code des Journalismus, in dem die Vermittlung absoluter Wahrheiten nicht 
vorrangig ist. Somit wird klar, dass sich einige Erkenntnisse aus der Forschung und 
Wissenschaft schneller verbreiten als andere. 

Krisen gelten nach den Sozialwissenschaftler:innen Folkers und Lim u. a. als 
Moment der Wahrheit. Eine Krise mag demnach Einblick in Aspekte der Gesell- 
schaft liefern, die zuvor unter der Oberfläche lagen und unbemerkt blieben. Oder 
eine solche soziale Wahrheit mag auch erst dann konstituiert werden, wenn eine 
Krise offiziell thematisiert wird. Mit anderen Worten: Es ist fraglich, ob eine Krise 
etwas enthüllt, das schon immer in unserer Gesellschaft vorhanden war, aber 
aufgrund von Unaufmerksamkeit oder anderen Faktoren übersehen wurde, oder ob 
die Benennung einer Situation als Krise dazu führt, dass wir diese Situation nun als 
Wahrheit akzeptieren, die zuvor nicht so betrachtet wurde.” Die Krise stelle 
demnach eine Art Gegenüber zur Ordnung dar und könne helfen, die Ordnung 


21 Ebd. 

22 Ebd. 

23 Vgl. Niklas Luhmann, Die Realität der Massenmedien, Opladen 19962, 56. 

24 Ebd., 170. 

25 Vgl. Andreas Folkers/Il-Tschung Lim, „Irrtum und Irritation. Für eine kleine Soziologie der Krise 
nach Foucault und Luhmann“, Behemoth - A Journal on Civilisation, Bd. 7, 2014, 48-69, 50. 
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besser zu verstehen, indem sie auf Dinge aufmerksam macht, die normalerweise 
verborgen oder unbeachtet seien. Diese werden normalerweise erst sicht- und 
analysierbar, wenn sie durch Probleme oder Bedrohungen in ihrer Integrität ge- 
fährdet werden.?® 

Der Unternehmer Elon Musk hat sich zu seinem geplanten LLM-Projekt na- 
mens „XAI“ geäußert, welches eine Konkurrenz zu ChatGPT und den GPT-Modellen 
von OpenAl darstellen soll. Die von Musk bevorzugte KI-Anwendung soll auf einem 
KI-Modell basieren, das nach „der Wahrheit“ strebt, eine Art „TruthGPT“, wobei die 
genauen Funktionsweisen noch nicht klar sind.”’ Sein bevorzugtes Konzept eines 
LLMs sei vor allem der Idee „der Wahrheit“ verpflichtet.” Bei genauerer Betrach- 
tung der Aussage Musks wird deutlich, dass er von einer einzigen, absoluten, bi- 
nären Wahrheitsvorstellung ausgeht. Diese zugespitzte Definition von Wahrheit 
lässt im Vergleich zu den genannten Wahrheitsbegriffen von Luhmann, Folkers und 
Lim den Prozess der Annäherung und Konstruktion weg. Diese Reduktion durch 
Elon Musk kann als seine Verdichtung und Filterung interpretiert werden, die 
persönliche philosophische oder religiöse Verständnisse aufdeckt, jedoch nicht den 
wissenschaftlichen Begriff von faktenbasierter Wahrheit verfolgt. Aus der geschil- 
derten sozialwissenschaftlichen Perspektive liefert sie lediglich eine Interpretation 
des Wahrheitsbegriffes, der im Rahmen einer gesellschaftlich akzeptierten Kon- 
vention existieren kann. Die Stärke dieses Rahmens liegt darin, dass er durch ge- 
sellschaftliche Interpretation korrigiert werden kann und im Gegensatz zu Musks 
Aussage keine Singularität im Wahrheitsbegriff durch eine Person oder ein nor- 
matives System beansprucht. Ein möglicherweise drohendes Szenario, bei dem 
gesellschaftliche Ebenen durch die Konstruktion des Wahrheitsbegriffs ausge- 
schlossen werden und dadurch eine generelle Ablehnung gegenüber der Wahrheit 
entstehen kann, sei folgendermaßen geschildert: Eine singuläre, „anspruchsvolle“ 
Wahrheit könnte in Zukunft durch ein KI-System gewährleistet werden, welche 
nirgendwo sonst in der Gesellschaft erzeugt werden kann. Dies ermöglicht einen 
eher „rücksichtslosen“ Ansatz bei Fragen der Wahrheit, insbesondere ohne Aner- 
kennung von alltäglichen Plausibilitäten und ohne Berücksichtigung religiöser oder 
politischer Konventionen. Letztere würden ersetzt werden durch die Gewichtungs- 
und Kostenfunktion des KI-Modells sowie dessen technischen Charakteristika. Im 


26 Vgl. Jürgen Habermas, Theorie des kommunikativen Handelns, Bd. 2, Zur Kritik der funktiona- 
listischen Vernunft, Frankfurt a.M. 1981, 59. 

27 Vgl. APA/Reuters, „TruthGPT: Musk plant maximal wahrheitssuchende KI“, 2023, in [diepres- 
se.com/6277020/truthgpt-musk-plant-maximal-wahrheitssuchende-ki] (Zugriff: 20.09.2023). 

28 Vgl. Parker Molloy, „Vaporware King Elon Musk’s XAI is Basically Just a 2023 Version of 
Microsoft’s Tay“, The Present Age, 2023, in [wwwreadtpa.com/p/vaporware-king-elon-musks-xai-is] 
(Zugriff: 20.09.2023). 
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Zuge dessen kann das menschliche Denken als mehr als nur logisches Problemlösen 
interpretiert werden. Anders als bei zweckrationaler Intelligenz kommt es nicht 
nur darauf an, was als faktisch oder wahr definiert wird, sondern vor allem darauf, 
wie die Gesellschaft die Definition interpretiert und wertet. Niklas Luhmann ar- 
gumentierte,”° dass Wahrheit im Wesentlichen das Ergebnis von Kommunikati- 
onsprozessen innerhalb sozialer Systeme sei. Innerhalb dieser Prozesse würden 
Informationen ausgewählt, interpretiert und akzeptiert, was dazu führe, dass 
Menschen unterschiedliche Vorstellungen von der Realität und Wahrheit entwi- 
ckeln. Diese Vorstellungen von Realität seien jedoch nicht fest in Stein gemeißelt, 
sondern flexibel und abhängig von den Normen und Regeln, die in einem be- 
stimmten sozialen System gelten. In dieser Entwicklung spiegelt sich auch die 
Systemtheorie von Niklas Luhmann wider.” Sie betont, dass in der modernen Ge- 
sellschaft verschiedene Teilsysteme existieren, die in gewisser Weise autark sind 
und unterschiedliche Regeln und Logiken haben. Die Nutzung von generativen KI- 
Systemen zur Wahrheitsfindung könnte demzufolge auch als ein eigenständiges 
Teilsystem betrachtet werden, das seine eigenen Verfahren und Maßstäbe hat, die 
sich von denen anderer Teilsysteme wie Religion, Journalismus, Forschung oder 
Politik unterscheiden. Die oben beschriebene Aussage von Elon Musk gestaltet darin 
ein theoretisches Szenario, in dem die Wahrheitsfindung durch KI-Systeme alle 
gesellschaftlichen Teilbereiche dominieren würde. Soziologische Theorien be- 
schreiben die Digitalisierung als Antwort auf die immer größere Komplexität der 
Moderne.” Je unübersichtlicher das Thema, desto wichtiger wird eine intelligente 
Mustererkennung. Der KI-Forscher Pedro Domingos von der University of Wa- 
shington treibt es sogar noch weiter und behauptet, dass die Wissenschaft ohne 
Computer überhaupt keine grundlegenden Fortschritte mehr gemacht hätte.?? 

Ein weiterer Ansatz besteht darin, die Antworten der KI-Modelle durch 
menschliches Feedback zu verbessern, bei dem deren Wahrheitsgehalt beurteilt 
wird.” Doch die Tatsache, dass GPT-4 gefälschte Artikelzitate generieren kann, 
verdeutlicht die Notwendigkeit, menschliche Überprüfungen und Qualitätskon- 
trollen in den Einsatz von KlI-gesteuerten Tools einzubeziehen, um Fehlinforma- 
tionen und Datenverzerrungen zu vermeiden. Für Fachgebiete mit eng gefassten 


29 Vgl. Niklas Luhmann, Die Wissenschaft der Gesellschaft, Frankfurt a. M. 1992, 22-23. 

30 Vgl. ebd., 355-358. 

31 Vgl. Jutta Rump/Silke Eilers, „Im Fokus: Digitalisierung und soziale Innovation. Konsequenzen 
für das System Arbeit“, in Auf dem Weg zur Arbeit 4.0., hg. von dens., Berlin/Heidelberg 2017, 79-80. 
32 Vgl. Pedro Domingos, The Master Algorithm: How the Quest for the Ultimate Learning Machine 
will Remake our World, New York 2015, 16. 

33 Vgl. Eva Wolfangel, „Wie man Chatbots die Wahrheit beibringt“, Zeit Online, 2023, in [https://tip. 
de/kehsb] (Zugriff: 20.09.2023). 
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Themen ist besondere Vorsicht geboten, da hier das Risiko von Fehlern bei der 
Zitation von Referenzen erhöht ist.** Die wichtigsten Anwendungen von LLMs im 
wissenschaftlichen Kontext umfassen laut Antun Chen Textverbesserung, Textzu- 
sammenfassung, Textanalyse, Programmierung, Ideengenerierung und Textüber- 
setzung. Die Expertinnen sehen in LLMs ein Potenzial zur Transformation wis- 
senschaftlicher Praktiken, insbesondere im textbasierten Arbeiten, und eine 
Möglichkeit zur Zeitersparnis in administrativen Aufgaben. Die Experten bewerten 
Halluzinationen als die schwerwiegendste Einschränkung, gefolgt von Nicht- 
Transparenz und mangelnder Spezifität. 

In allen drei Blickwinkeln wird die Herausforderung deutlich, dass die Ver- 
breitung von Fehlinformationen durch generative KI-Systeme dazu führen könnte, 
dass KI-Modelle in Zukunft fehlerhaften Daten rezipieren. Dies hätte zur Folge, dass 
sowohl die technischen Charakteristika als auch die gesellschaftlichen Auswir- 
kungen der Sprachmodelle in einer rekursiven und konvergierenden Weise ver- 
stärkt werden könnten, während sie zunehmend als ein iteratives Teilsystem der 
Wahrheit hineinwirken könnten. Ein Szenario ist, dass die Gesellschaft mögliche 
Fehlinformationen zunehmend übernehmen könnte, da Menschen aufgrund der 
Datenquantität die Aussagen nicht vollständig überprüfen können.°° Andernfalls 
könnte die Gesellschaft sich aufgrund ihrer zunehmend geringeren Wirkungs- und 
Repräsentationsmacht expandierend vom Konzept der Wahrheit durch KI-Systeme 
abwenden. In unterschiedlichen Szenarien ist also zu betrachten, dass KI-Systeme 
zu einer weiteren Verschachtlung des Begriffs der Wahrheit führen könnten. 

Hinzu kommt, dass der gegenwärtige Zustand dem Muster folgt, welches durch 
die moderne Differenzierung der Realität zunehmend mehr Meinungen anstelle 
von Wahrheit hervorbringt.’° Das Weltbild des Bürgertums sieht sich heute von 
zwei Fronten bedroht: einem zunehmenden Konformitätsdruck und einer Oligar- 
chisierung der Wahrheitsfindung von oben sowie der steigenden Anzahl von Fake 
News von unten. Im Sinne von Luhmann kann gesagt werden, dass technologische 
Entwicklungen sich zwischen Sender und Empfänger schieben und somit den 
Prozess der Wahrheitsbildung und -vermittlung beeinflussen. Dies geschieht, indem 
sie die Art und Weise verändern, wie Informationen erstellt, verarbeitet und 
übertragen werden. Dadurch kann der klare Bezug zur Realität und zur Wahrheit 


34 Vgl. Anjun Chen, „Accuracy of Chatbots in Citing Journal Articles“, 2023, in [jamanetwork.com/ 
journals/jamanetworkopen/fullarticle/2808058] (Zugriff: 22.09.2023). 

35 Vgl. Jannis Brühl, „Chat-GPT wird benutzt, um Bullshit zu automatisieren“, Süddeutsche Zeitung, 
2023, 15, in [sueddeutsche.de/wirtschaft/chatgpt-ki-kuenstliche-intelligenz-kapoor-1.5771936] (Zugriff: 
24.09.2023). 

36 Vgl. Ulf Daniel Ehlers, Wissenschaftstheorien-Vorlesung, 2013, in [slideshare.net/uehlers/wissen- 
schaftstheorien-vorlesung] (Zugriff: 22.09.2023). 
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verwischt oder verzerrt werden. Es wird deutlich, dass die Herausforderung darin 
besteht, Wege zu finden, um das Vertrauen in authentische Informationen wie- 
derherzustellen und die Menschen dazu zu ermutigen, sich aktiv mit der Realität 
auseinanderzusetzen, trotz der Schwierigkeiten im Umgang mit gefälschten Infor- 
mationen. 


5 Human-Al Hybrid: Chancen und Risiken für 
wissenschaftliche Diskurse 


Seit drei Jahren ist der Begriff „Human-AI Hybrid“ (auch umgekehrt als „Hybrid 
Human-AI“ bekannt) in den Mittelpunkt des wissenschaftlichen Interesses ge- 
rückt.” Um den Begriff hat sich ein eigenes Forschungsfeld entwickelt, in dem die 
Wissenschaftler:innen das Ziel verfolgen, KI-Systeme zu entwickeln, die einerseits 
den Menschen unterstützen und andererseits durch menschliche Fähigkeiten er- 
gänzt werden.” Der Fokus liegt somit auf der Schaffung adaptiver, kollaborativer, 
verantwortungsbewusster und interaktiver KI-Systeme, die menschenzentriert 
sind. Diese Systeme sollen die Stärken des Menschen hervorheben und seine 
Schwächen kompensieren, während sie soziale, ethische und rechtliche Aspekte 
berücksichtigen. Es geht demnach nicht um Mensch-Maschine-Hybride wie Cyborgs, 
sondern vielmehr um die Beziehung und Zusammenarbeit zwischen organischen 
Menschen und synthetischen Systemen. Wissenschaftliche Arbeiten, die diesen 
Begriff mit der genannten Bedeutung verwenden, erscheinen bereits seit mindes- 
tens 2020;”° 2022 wurde zum ersten Mal eine internationale Konferenz in Amster- 
dam veranstaltet, die fortan jährlich in wechselnden Städten stattfindet.’ 

Die Entstehung des Begriffs lässt sich auf die jüngsten Fortschritte in den KI- 
Technologien zurückführen, insbesondere auf die Entwicklung von Systemen wie 
ChatGPT, Midjourney und deren generativen Verwandten. Diese Systeme haben 


37 Vgl. z. B. Inge Molenaar, Towards hybrid human-AI learning technologies, 2022 in [onlinelib- 
rary.wiley.com/doi/full/10.1111/ejed.12527] (Zugriff: 30.09.2023); Filipe Dwan Pereira et al., Towards a 
Human-AI Hybrid System for Categorising Programming Problems, 2021, in [dl.acm.org/doi/10.1145/ 
34088773432422] (Zugriff: 30.09.2023); Kenneth Holstein et al., A Conceptual Framework for Human- 
AI Hybrid Adaptivity in Education, 2020, in [www.doi.org/10.1007%2F9783-030-522377_20] (Zugriff: 
30.09.2023). 

38 Vgl. HHAI2023, „Call for Papers. Hybrid Human-Artificial Intelligence“, 2023, in [https://hhai-confe 
rence.org/2023/cfp/] (Zugriff am10.10.2023). 

39 Vgl. Chen et al. 2020. 

40 Vgl. HHAI, „International Conference Series on Hybrid Human-Artificial Intelligence“, 2023, in 
[https:/hhai-conference.org/] (Zugriff am 10.10.2023). 
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gezeigt, dass KlI-Anwendungen nicht nur dazu verwendet werden können, 
menschliche Aufgaben zu automatisieren, sondern auch, um menschliche Fähig- 
keiten zu erweitern und zu bereichern. 

Eine übliche Kategorisierung von Mensch-Maschine-Hybriden hat sich noch 
nicht hervorgetan, weswegen im Folgenden eine solche Kategorisierung anhand der 
Rolle des KI-Systems gegenüber dem Menschen vorgeschlagen wird. Diese Rollen 
lauten „Dominator“, „Facilitator“ und „Operator“. Um diese Kategorien zu veran- 
schaulichen, werden sie mithilfe von Beispielen aus der Forschung bzw. Wissen- 


schaft erläutert. 


Tabelle 1: Kategorisierung des Human-Al-Hybrid anhand der Rolle des KI-Systems gegenüber dem 


Menschen. 

Rolle Erklärung Beispiel 

Dominator In dieser Kategorie dominiert das KI-System Ein KI-System analysiert autonom große 
das Zusammenspiel und trifft Entscheidun- Datensätze von astronomischen Beobach- 
gen eigenständig, basierend auf den ihm zur tungen, um neue Exoplaneten zu identifi- 
Verfügung stehenden Daten. Hierbei agiert zieren. Die Wissenschaftler:innen überprü- 
der Mensch vorwiegend als Beobachter fen die Ergebnisse und nehmen 
oder Korrektor, hat demnach wenig bis gar gegebenenfalls Korrekturen vor, haben aber 
keinen direkten Einfluss auf die Aktionen der wenig direkten Einfluss auf den Entde- 
KI. Bezogen auf die Wissenschaft würde es ckungsprozess. 
bedeuten, dass in dieser Kategorie die KI die 
Hauptrolle im Forschungsprozess über- 
nimmt, indem sie Daten autonom analysiert 
und Interpretationen anbietet. Wissen- 
schaftler:innen fungieren hier hauptsächlich 
als Beobachter oder Korrektoren, um die 
Ergebnisse zu überprüfen und gegebenen- 
falls zu korrigieren. 

Facilitator In der Kategorie „Facilitator“ arbeiten Ein KI-System arbeitet mit Geowissenschaft- 


Mensch und KI-System Hand in Hand, wobei 
beide Parteien gleichberechtigt Entschei- 
dungen treffen und Aktionen durchführen. 
Es handelt sich um eine echte Partnerschaft, 
in der die Stärken und Schwächen beider 
Parteien berücksichtigt werden. Hier arbei- 
ten KI und Wissenschaftler:innen also ge- 
meinsam daran, Forschungsfragen zu un- 
tersuchen und zu beantworten. Die 
Partnerschaft ermöglicht es, die Stärken 
beider Parteien zu nutzen und zu einer 


ler:innen zusammen, um Erdbebenrisiken zu 
analysieren. Das System liefert eine vorläu- 
fige Analyse der seismischen Daten, die 
Wissenschaftler:innen bringen ihre Expertise 
in die nachfolgende Interpretation der Er- 
gebnisse ein. Gemeinsam entwickeln sie ein 
umfassendes Verständnis der Erdbebenrisi- 
ken in einer bestimmten Region. 
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Tabelle 1: Kategorisierung des Human-Al-Hybrid anhand der Rolle des KI-Systems gegenüber dem 
Menschen. (Fortsetzung) 
Rolle Erklärung Beispiel 


fundierten Entscheidung oder Interpretation 
zu gelangen. 


Operator Hier fungiert das KI-System als Unterstützer: Ein KI-System unterstützt Chemiker:innen 
in oder Assistenz des Menschen. Es bietet bei der Analyse von Molekülstrukturen und 
Vorschläge, Analysen und Einblicke, basie- bietet Vorschläge für mögliche neue Syn- 
rend auf seinen Algorithmen und Daten, thesewege. Die endgültige Entscheidung 
während der Mensch die endgültige Ent- über die zu verfolgenden Synthesewege und 
scheidung trifft. In dieser Kategorie agiert die Interpretation der Ergebnisse liegt je- 
die KI als Unterstützer:in der Wissenschaft- doch bei den Wissenschaftler:innen. 
ler:innen, indem sie Datenanalysen und In- 
terpretationssupport anbietet, aber die 
endgültigen Schlussfolgerungen den Wis- 
senschaftler:innen überlässt. 


Diese Einteilung spiegelt die verschiedenen Grade der Interaktion und Integration 
zwischen Mensch und KI wider und wird daher als Einteilung für den weiteren 
Diskurs im Bereich des Human-AI Hybrids empfohlen. 

Die Einteilung des Human-AI Hybrids in die Kategorien „Dominator“, „Facili- 
tator“ und „Operator“ wirft eine Reihe von ethischen, sozialen und wissenschaft- 
lichen Fragen auf. Sie impliziert beispielsweise, dass in der „Dominator“-Kategorie 
die Gefahr bestünde, dass KI-Systeme Entscheidungen treffen, die ethisch frag- 
würdig oder sogar gefährlich sein könnten. Wenn z. B. ein KI-System, das medizi- 
nische Diagnosen stellt, ohne ausreichende menschliche Überprüfung stellt, könnte 
dies zu einem fehlerhaften Behandlungsplan führen. In den Kategorien „Facilitator“ 
und „Operator“ liegt die ethische Verantwortung mehr beim Menschen, aber auch 
hier gibt es Fallstricke, wie die mögliche Verzerrung von Daten oder Diskriminie- 
rung. Die Integration von KI-Systemen in den menschlichen Entscheidungsprozess 
könnte ebenfalls zu sozialen Veränderungen führen, insbesondere in Bezug auf die 
Rolle von Fachleuten. In der „Operator“-Kategorie könnte der Einsatz von KI-As- 
sistenten dazu führen, dass weniger qualifizierte Personen in der Lage sind, kom- 
plexe Aufgaben zu erfüllen, was die Rolle von Experten verändert. Im „Facilitator“- 
Modus könnten KI-Systeme als gleichwertige Partner angesehen werden, was die 
soziale Dynamik in Teams und Organisationen verändern könnte. 

In einem wissenschaftlichen Kontext könnte die Möglichkeit, KI in Diskursen 
als „Facilitator“ oder „Operator“ einzusetzen, neue Wege für die Forschung bieten. 
KI-Systeme könnten dazu verwendet werden, wissenschaftliche Daten zu analy- 
sieren, Hypothesen zu generieren oder sogar bei der Formulierung von For- 
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schungsfragen zu helfen. Allerdings ergeben sich auch Fragen zur Validität und 
Reproduzierbarkeit von KI-generierten Daten und Erkenntnissen. 

Wird ChatGPT mit dem Modell GPT-4 selbst dazu befragt, welche Implikationen 
sich aus generativen KI-Systemen für den wissenschaftlichen Diskurs ergeben, so 
gibt es folgende Antwort: „Generative KI-Systeme, wie GPT-4, haben das Potenzial, 
den wissenschaftlichen Diskurs in vielerlei Hinsicht zu beeinflussen [...].“*" Es fährt 
fort mit der Nennung einiger Implikationen, die sich teils mit den zuvor beschrie- 
benen decken. Beispielsweise könne generative KI einerseits dabei helfen, das 
Forschungstempo zu beschleunigen (s. auch Abschnitt 2). Andererseits steige auch 
das Risiko, dass sich Fehlinformationen verbreiten, die „insbesondere dann pro- 
blematisch werden, wenn diese Inhalte als wissenschaftliche Tatsachen präsentiert 
werden.“ (s. auch Abschnitt 2, Risiken von KI-Sprachmodellen, sowie Abschnitt 4). 
Wie bereits in Abschnitt 2 erwähnt wurde, ist mit KI-Sprachmodellen auch das 
Risiko einer kriminellen oder absichtlich irreführenden Nutzung verknüpft. Auch 
auf dieses Risiko weist der Chatbot im wissenschaftlichen Zusammenhang hin. 
Nicht nur Fragen zu „Urheberschaft und Anerkennung von Beiträgen“ könnten 
auftreten, generative KI könnte auch zur gezielten Produktion von falschen Studi- 
energebnissen genutzt werden. 

Zusätzlich zu den in diesem Beitrag bereits aufgezeigten Implikationen hält 
ChatGPT aber auch weitere Ideen für Implikationen bereit. So könnten „Generative 
Systeme [...] dazu verwendet werden, wissenschaftliche Erkenntnisse in einer leicht 
verständlichen Form für ein breiteres Publikum zu präsentieren.“ Dies könnte die 
Leistungsfähigkeit und Geschwindigkeit der Wissenschaftskommunikation erhö- 
hen. In diesem Zusammenhang wird ebenfalls der Begriff der „Zugänglichkeit“ 
genannt. Die Systeme könnten „den Zugang zu wissenschaftlichen Informationen 
erleichtern“ und insofern zur Demokratisierung in der Wissenschaft beitragen. Ein 
weiterer Vorteil, den ChatGPT für den wissenschaftlichen Diskurs bei der Nutzung 
von KI-Systemen sieht, ist ein kollaborativer Ansatz. Durch die Nutzung generativer 
KI könnten Perspektiven anderer Forschungsdisziplinen direkt mit in die eigenen 
Forschungserkenntnisse einfließen, ohne auftatsächlichen Kontakt oder Austausch 
mit Expert:innen aus dem betreffenden Feld angewiesen zu sein. 

Am Ende des Dialogs weist der Chatbot noch auf Folgendes hin: 


Schließlich, wie bei jeder Technologie, hängen die tatsächlichen Auswirkungen von generati- 
ven KI-Systemen auf den wissenschaftlichen Diskurs von ihrer Anwendung und Implemen- 
tierung ab. Es ist wichtig, sowohl die Vorteile als auch die potenziellen Risiken zu berück- 


41 Der gesamte Chatverlauf kann hier eingesehen werden: https://chat.openai.com/share/43a68546- 
5ea9-4eae-9673-fcfb35f4f42d, generiert am 09.08.2023. 
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sichtigen und Richtlinien und Best Practices zu entwickeln, um sicherzustellen, dass sie ethisch 
und effektiv eingesetzt werden. 


Entsprechend dieser Aussage wurden im Laufe des Beitrags im Kontext des Human- 
AI Hybrids sowohl Chancen als auch Herausforderungen aufgezeigt. Die genannten 
Implikationen führen zu weiteren entscheidenden Fragen bezüglich der Verant- 
wortung und möglicher Auswirkungen auf unsere Informationslandschaft (vgl. 
auch Abschnitt 4). 

Die Frage, ob gemäß dem Begriff in Abschnitt 4 eine realitätsverfälschende 
„Infokalypse“ bevorsteht oder ob Wissenschaftler:innen bzw. die Gesamtgesell- 
schaft sich bereits in dieser befinden, bleibt noch offen. Die Bewältigung der Her- 
ausforderungen, die durch KI-Systeme auch im wissenschaftlichen Kontext entste- 
hen, wird vermutlich eine breite interdisziplinäre Zusammenarbeit und ein 
kollektives Engagement erfordern. 


6 Schlussfolgerungen und Ausblick 


Im vorliegenden Beitrag wurden einige der Einsatzmöglichkeiten und Auswirkun- 
gen der KI auf den gesellschaftlichen und wissenschaftlichen Diskurs untersucht. 
Durch das Aufzeigen unterschiedlicher Perspektiven und Konzepte wurde deutlich, 
dass die rasante Entwicklung von KI-Systemen die Art und Weise, wie wir Wahrheit 
definieren und erkennen, grundlegend verändert und dabei ethische, soziale und 
wissenschaftliche Fragen entstehen. 

Die Diskussion um die Konzeption von Wahrheit in der KI-Ära offenbart die 
Problematik einer alleinigen Abhängigkeit von technologischen Systemen zur 
Wahrheitsfindung. Die Betrachtung von z. B. Elon Musks LLM-Projekt xAI und die 
Analyse des Human-Al Hybrids verdeutlichen die Notwendigkeit einer ausgewoge- 
nen Mensch-Maschine-Interaktion, um die Stärken beider zu nutzen. Die Einteilung 
der Mensch-Maschine-Hybriden in „Dominator“, „Facilitator“ und „Operator“ bietet 
eine mögliche Grundlage für die weitere Erforschung und Entwicklung von KI- 
Systemen, die auf eine harmonische Zusammenarbeit mit menschlichen Akteuren 
abzielen. Dabei ist es von zentraler Bedeutung, ethische Richtlinien und Best 
Practices zu etablieren, um die Integrität der Wahrheitsfindung und die soziale 
Verantwortung zu gewährleisten. 

In Zukunft könnte die Weiterentwicklung von KI-Systemen, insbesondere im 
Bereich der generativen Modelle, neue Horizonte für die wissenschaftliche For- 
schung und Praxis eröffnen. Die Möglichkeit, KI als „Facilitator“ oder „Operator“ in 
wissenschaftlichen Diskursen einzusetzen, könnte die Forschung beschleunigen 
und zu interdisziplinären Entdeckungen führen. Gleichzeitig ist es unerlässlich, die 
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Risiken von Fehlinformationen und Datenverzerrungen ernst zu nehmen und 
Mechanismen zur Qualitätssicherung und menschlichen Überprüfung zu imple- 
mentieren. 

Es bleibt viel Raum für weitere Forschung, insbesondere im Hinblick auf die 
langfristigen Auswirkungen dieser Technologien auf die Gesellschaft und die Wis- 
senschaft. Zukünftige Studien könnten sich auf die Entwicklung von Best Practices 
für die Ethik und Governance von Human-Al Hybrids konzentrieren, um sicher- 
zustellen, dass diese Technologien auf eine Weise eingesetzt werden, die dem Ge- 
meinwohl dient. 


Autor:innen-Erklärung 


Für diese Ausarbeitung hat das Team der Autor*innen folgende Werkzeuge aus dem 
Bereich generativer KI bzw. KI-gestützter Schreibwerkzeuge genutzt: 

—  ChatPDF zur Ideengenerierung. 

—  ChatGPT zur Ideengenerierung, für erste Entwürfe und als Formulierungshilfe. 


Nach der Nutzung dieser Tools/Dienste haben die Autor:innen den Inhalt nach 
Bedarf überprüft und bearbeitet und übernehmen die volle Verantwortung für den 
Inhalt der Veröffentlichung. 


Thomas Otmar Arnold 

Herausforderungen in der Forschung: 
Mangelnde Reproduzierbarkeit und 
Erklärbarkeit 


Abstract: Current language models and generators such as ChatGPT have several 
characteristics that make them difficult to analyse by researchers in disciplines 
such as Natural Language Processing. These technologies are not publicly available 
and must be used on external servers, which makes them dependent on external 
models. This makes it much more difficult to reproduce research results because 
there is no way to store specific versions ofthe model, examine or change the code, 
and compare the results over time. This creates a hurdle in the reproducibility of 
research results, which is essential for scientific progress and credibility. Another 
significant problem is the explainability of the results. In particular, neural net- 
works, which serve as the basis for language generators, are known to be „black 
boxes“. Although we can observe what outputs they produce, interpreting the ge- 
neration process and the underlying decisions is still extremely challenging. This 
limitation of explainability makes it particularly difficult to use such models in 
sensitive application areas. There are several possible approaches to address these 
challenges. Promoting reproducibility requires supporting open and comprehensi- 
ble research practices. Here, language models could serve as open-source projects 
with a transparent training process to provide deeper insights into the opportuni- 
tiesand risks of this technology. In terms of explainability, researchers should seek 
methods to better understand the decision-making of neural networks and other 
complex models. This may involve developing explanatory techniques and exploring 
models that are more interpretable. 


1 Einleitung 


Die rasante Entwicklung von Künstlicher Intelligenz (KI) hat in den letzten Jahren 
zu erstaunlichen Fortschritten geführt, insbesondere im Bereich der natürlichen 
Sprachverarbeitung. Große Sprachmodelle wie GPT-3 und speziell ChatGPT sind zu 
Aushängeschildern dieser technologischen Revolution geworden. Diese Modelle 
können Texte generieren, die menschlichem Schreiben verblüffend ähnlich sind 
und haben das Potenzial, eine Vielzahl von Anwendungen zu transformieren, von 
automatisierten Kundensupport-Chatbots bis hin zur Unterstützung von Schrift- 
stellern bei der Texterstellung. 


8 Open Access. © 2024 bei den Autorinnen und Autoren, publiziert von De Gruyter. Dieses Werk ist 
lizenziert unter einer Creative Commons Namensnennung - Nicht kommerziell - Keine Bearbeitung 4.0 International 
Lizenz. https:/doi.org/10.1515/9783111351490-006 
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Während diese Fortschritte zweifellos aufregend sind, haben sie auch eine 
neue Reihe von Herausforderungen und Fragen aufgeworfen, die die Forschungs- 
und Entwicklergemeinschaften gleichermaßen beschäftigen. In dieser Ära großer 
Sprachmodelle sind die Reproduzierbarkeit von Forschungsergebnissen und die 
Erklärbarkeit der Entscheidungen dieser Modelle zu zentralen Anliegen geworden. 

Die Reproduzierbarkeit von Forschungsergebnissen ist ein Grundpfeiler der 
wissenschaftlichen Methodik. Sie gewährleistet, dass die in wissenschaftlichen 
Arbeiten beschriebenen Ergebnisse von anderen Forschenden unabhängig über- 
prüft werden können. Traditionell war die Reproduzierbarkeit in vielen wissen- 
schaftlichen Disziplinen relativ unproblematisch. Forschungsergebnisse wurden in 
Form von Fachartikeln veröffentlicht, die detaillierte Informationen über die Me- 
thoden, die verwendeten Daten und den Code enthielten. Andere Personen in der 
Wissenschaft konnten diese Informationen nutzen, um die Experimente zu wie- 
derholen und die Ergebnisse zu verifizieren. In der Ära großer Sprachmodelle ist 
diese Reproduzierbarkeit jedoch gefährdet. Modelle wie ChatGPT sind nicht öf- 
fentlich zugänglich und können nur über externe Server genutzt werden. For- 
schende, die diese Modelle verwenden möchten, sind daher auf die Bereitstellung 
solcher Dienste angewiesen. Dies führt zu einer starken Abhängigkeit von den ex- 
ternen Modellen und den bereitgestellten Schnittstellen. 

Das Problem dabei ist, dass Forschende keine Kontrolle über die Modellver- 
sionen haben, die sie verwenden, und keinen Zugriff auf den zugrunde liegenden 
Code haben, um Anpassungen vorzunehmen. Dies erschwert die Reproduzierbar- 
keit erheblich. Es gibt keine Möglichkeit, sicherzustellen, dass die Modellversion, die 
bei der Durchführung eines Experiments verwendet wurde, auch zu einem späte- 
ren Zeitpunkt verfügbar ist. Dies ist insbesondere problematisch, da externe Mo- 
delle sich im Laufe der Zeit ändern können, sei es durch Aktualisierungen oder 
Modifikationen seitens der Anbieter. 

Die mangelnde Reproduzierbarkeit ist nicht nur ein methodisches Problem, 
sondern hat auch weitreichende Auswirkungen auf die Glaubwürdigkeit von For- 
schungsergebnissen und den wissenschaftlichen Fortschritt. Wenn andere For- 
schende nicht in der Lage sind, die Experimente zu wiederholen und die Ergebnisse 
zu überprüfen, kann die Grundlage für die wissenschaftliche Methode untergraben 
werden. Dies kann zu einer Erosion des Vertrauens in die Forschung führen und 
den Fortschritt in vielen Disziplinen behindern. Ein weiteres bedeutendes Problem, 
das sich aus der Verwendung großer Sprachmodelle ergibt, betrifft die Erklärbar- 
keit der Ergebnisse. Diese Modelle, insbesondere solche, die auf neuronalen Netzen 
basieren, sind als „black box“ bekannt. Das bedeutet, dass sie äußerst komplexe 
interne Strukturen haben, die schwer verständlich sind. Obwohl wir die Ausgaben 
dieser Modelle beobachten können, ist die Interpretation des Generationsprozesses 
und der zugrunde liegenden Entscheidungen äußerst herausfordernd. 
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Wenn ein Text von einem Sprachgenerator wie ChatGPT erstellt wird, ist es 
schwer nachzuvollziehen, warum genau dieser Text generiert wurde und welche 
internen Gewichtungen und Muster dazu geführt haben. Dies stellt eine erhebliche 
Barriere dar, insbesondere wenn es darum geht, derartige Modelle in sensiblen 
Anwendungsbereichen einzusetzen, bei denen eine klare Erklärbarkeit der Ent- 
scheidungen unerlässlich ist. Insbesondere gilt dies für Anwendungen im medizi- 
nischen Bereich, in der Rechtsprechung oder in der Finanzindustrie, wo es ent- 
scheidend ist, nachvollziehen zu können, wie eine Entscheidung getroffen wurde. 

Die Erklarbarkeit von KI-Systemen ist jedoch nicht nur aus ethischer Sicht 
wichtig. Sie hat auch praktische Auswirkungen auf die Anwendung und Akzeptanz 
dieser Systeme in der Gesellschaft. Menschen neigen dazu, Technologien eher zu 
akzeptieren und zu vertrauen, wenn sie verstehen, wie sie funktionieren und 
welche Entscheidungen sie treffen. Intransparente KI-Systeme können Ängste und 
Misstrauen schüren, was ihre breite Akzeptanz behindert. 

Die Ära großer Sprachmodelle hat zweifellos das Potenzial, bahnbrechende 
Fortschritte in der menschlichen Kommunikation und Kreativität zu bringen. 
Dennoch müssen wir die Herausforderungen in Bezug auf Reproduzierbarkeit und 
Erklärbarkeit ernst nehmen, um sicherzustellen, dass diese Modelle verantwor- 
tungsbewusst eingesetzt werden können. Die Förderung offener Praktiken und die 
Erforschung der Erklärungsmethoden sind entscheidende Schritte auf dem Weg zu 
einer transparenten und verlässlichen KI-Zukunft. 


2 Reproduzierbarkeitsherausforderungen 


Die Reproduzierbarkeit von Forschungsergebnissen ist ein grundlegendes Prinzip 
wissenschaftlicher Methodik. Sie stellt sicher, dass die in wissenschaftlichen Ar- 
beiten beschriebenen Ergebnisse von anderen Forschenden unabhängig überprüft 
und validiert werden können. Dieses Prinzip ist besonders in den Natur- und So- 
zialwissenschaften von großer Bedeutung, da es die Grundlage für den wissen- 
schaftlichen Fortschritt und die Glaubwürdigkeit der Forschung bildet. Allerdings 
sind die Fortschritte in der Künstlichen Intelligenz (KI) und insbesondere im Be- 
reich der großen Sprachmodelle, wie ChatGPT, zu einer Herausforderung für die 
Reproduzierbarkeit geworden. 


2.1 Externe Abhängigkeit und mangelnde Kontrolle 


Eine der zentralen Herausforderungen in Bezug auf die Reproduzierbarkeit in der 
Ära großer Sprachmodelle besteht darin, dass diese Modelle nicht öffentlich zu- 
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gänglich sind und auf externen Servern betrieben werden. Forschende sind daher 
angewiesen, auf diese externen Dienste zuzugreifen, um ihre Experimente durch- 
zuführen. Dies führt zu einer starken Abhängigkeit von den externen Modellen und 
den bereitgestellten Schnittstellen. 

Die Abhängigkeit von externen Modellen hat mehrere nachteilige Auswirkun- 
gen auf die Reproduzierbarkeit. Erstens haben Forschende keine Kontrolle über die 
Wartung und Aktualisierung dieser Modelle. Die Modelle können sich im Laufe der 
Zeit ändern, sei es durch Modellverbesserungen, Aktualisierungen der Trainings- 
daten oder andere Faktoren. Dies bedeutet, dass die Modellversion, die Forschende 
in ihrer Arbeit verwendet haben, möglicherweise nicht mehr verfügbar ist oder sich 
von der aktuellen Version unterscheidet. Dies erschwert die Nachvollziehbarkeit 
von wissenschaftlichen Ergebnissen erheblich." 

Zweitens können externe Dienste unerwartet unzugänglich werden oder ihre 
Nutzungseinschränkungen können sich ändern. Die Wissenschaft könnte plötzlich 
den Zugriff auf das Modell verlieren oder mit neuen Nutzungsbedingungen kon- 
frontiert werden, die ihre Forschung behindern. Dies führt zu Unsicherheiten in 
Bezug auf die Verfügbarkeit und die Bedingungen für die Nutzung der Modelle. 


2.2 Datenabhängigkeit und Datenschutz 


Ein weiterer Aspekt der Reproduzierbarkeitsherausforderungen betrifft die Ab- 
hängigkeit von den Trainingsdaten, die für die großen Sprachmodelle verwendet 
werden. Diese Modelle werden aufumfangreichen Textkorpora trainiert, die oft aus 
öffentlich verfügbaren Texten im Internet stammen. Die genaue Zusammensetzung 
dieser Trainingsdaten ist jedoch selten vollständig dokumentiert und kann sich im 
Laufe der Zeit ändern. 

Die Abhängigkeit von diesen Trainingsdaten macht es schwierig, Experimente 
zu reproduzieren, da Forschende möglicherweise nicht über die gleichen Daten 
verfügen wie die ursprünglichen Modellentwickler. Selbst wenn die gleichen Daten 
verfügbar sind, könnten sie in der Zwischenzeit verändert oder aktualisiert worden 
sein, was zu Unterschieden in den Ergebnissen führen kann. 

Darüber hinaus gibt es Bedenken hinsichtlich des Datenschutzes bei der Ver- 
wendung von großen Textkorpora für das Training von Sprachmodellen. Diese 
Korpora können sensible Informationen enthalten, und die Verwendung solcher 
Daten ohne angemessene Anonymisierung und Einwilligung kann Datenschutz- 


1 Miles Brundage et al., „The Malicious Use of Artificial Intelligence: Forecasting, Prevention, and 
Mitigation“, arXiv preprint arXiv:2106.12647, 2021. 
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probleme aufwerfen. Dies stellt eine weitere Hürde für die Reproduzierbarkeit dar, 
da Forschende möglicherweise eingeschränkten Zugang zu den für das Training 
verwendeten Daten haben. 


2.3 Transparenz und Mangel an Dokumentation 


Die Transparenz des Trainingsprozesses und der Modellarchitekturen ist ein wei- 
teres zentrales Thema in Bezug auf die Reproduzierbarkeit. In vielen Fällen fehlt es 
an ausreichender Dokumentation darüber, wie genau die Modelle trainiert wurden, 
welche Daten verwendet wurden und welche Vorverarbeitungsschritte angewendet 
wurden. Dies erschwert die Nachvollziehbarkeit und Reproduzierbarkeit erheblich, 
da Forschende nicht genau wissen, wie die Modelle erstellt wurden. 

Die mangelnde Transparenz erstreckt sich auch auf die Modellarchitekturen 
selbst. Große Sprachmodelle wie ChatGPT haben komplexe interne Strukturen mit 
Millionen von Parametern, die schwer zu verstehen und zu analysieren sind. For- 
schende haben oft nur begrenzten Einblick in die Funktionsweise dieser Modelle, 
was es schwierig macht, ihre Entscheidungen und Vorhersagen nachzuvollziehen. 

Die Reproduzierbarkeit von Forschungsergebnissen in der Ära großer 
Sprachmodelle ist eine komplexe Herausforderung, die die wissenschaftliche Ge- 
meinschaft ernsthaft angehen muss. Die Abhängigkeit von externen Modellen und 
Trainingsdaten, mangelnde Transparenz und unzureichende Dokumentation sind 
zentrale Probleme. Dennoch gibt es Möglichkeiten, diese Herausforderungen zu 
bewältigen, indem offene Praktiken gefördert werden, die Transparenz erhöht wird 
und Datenschutzrichtlinien beachtet werden. Die Gewährleistung der Reproduzi- 
erbarkeit ist entscheidend, um sicherzustellen, dass die Forschung in der KI wei- 
terhin auf verlässlichen Grundlagen aufbaut und für die wissenschaftliche Ge- 
meinschaft von Nutzen ist. 


3 Erklärbarkeitsherausforderungen 


Die Erklärbarkeit von KI-Modellen, insbesondere von neuronalen Netzwerken, ist 
zu einem der zentralen Themen in der KI-Forschung geworden.” In der Ära großer 
Sprachmodelle wie ChatGPT sind diese Herausforderungen noch drängender. Wir 
stehen vor der Schwierigkeit, hochkomplexe Modelle zu verstehen, die menschen- 
ähnlichen Text generieren können, aber gleichzeitig als „black boxes“ gelten. 


2 Zachary Lipton, „The Mythos of Model Interpretability“, arXiv:1606.03490, 2016. 
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3.1 Die Komplexität von neuronalen Netzwerken 


Neuronale Netzwerke sind die Grundbausteine von modernen Sprachgeneratoren. 
Diese Netzwerke sind in der Lage, riesige Mengen an Daten zu verarbeiten und 
komplexe Muster zu erlernen. Allerdings geht diese Leistungsfähigkeit mit einer 
hohen Komplexität einher. Ein neuronales Netzwerk besteht aus Tausenden oder 
sogar Milliarden von Neuronen und Gewichtungen, die miteinander interagieren. 
Die interne Struktur solcher Netzwerke ist äußerst schwer nachvollziehbar. 


3.2 Die „Black Box“ der Entscheidungsfindung 


Die Entscheidungsfindung in einem neuronalen Netzwerk erfolgt durch das 
Durchlaufen einer Vielzahl von Neuronen und Gewichtungen. Wenn ein Sprach- 
generator wie ChatGPT einen Text generiert, geschieht dies aufgrund einer kom- 
plexen Abfolge von Berechnungen. Obwohl wir die Ausgaben dieser Berechnungen 
sehen können, bleibt die Interpretation des Prozesses äußerst herausfordernd. Dies 
ist vergleichbar mit dem Versuch, das Verhalten eines komplexen chemischen Re- 
aktionssystems zu erklären, ohne die genaue Struktur und Interaktion der Moleküle 
zu kennen. 

Die Tatsache, dass neuronale Netzwerke als „black boxes“ gelten, bedeutet, dass 
wir Schwierigkeiten haben, den internen Entscheidungsprozess nachzuvollziehen. 
Warum hat das Modell genau diesen Satz generiert? Welche Faktoren haben zu 
dieser Entscheidung geführt? Diese Fragen sind schwer zu beantworten, da wir 
keinen klaren Einblick in die internen Abläufe des Netzwerks haben.’ 


3.3 Herausforderungen in der Praxis 


Die mangelnde Erklärbarkeit von KI-Modellen wie ChatGPT hat erhebliche Aus- 
wirkungen auf deren Anwendbarkeit in verschiedenen Bereichen. In sensiblen 
Anwendungsbereichen, wie der Rechtswissenschaft, der Medizin oder der Finanz- 
branche, ist es von entscheidender Bedeutung, dass Entscheidungen nachvollzieh- 
bar sind. Wenn ein KI-Modell eine Empfehlung ausspricht oder eine Entscheidung 
trifft, muss es möglich sein, diese Entscheidung zu erklären. 

Ein Beispiel ist die medizinische Diagnose. Wenn ein KI-Modell eine bestimmte 
Krankheit diagnostiziert, müssen sowohl das medizinische Personal als auch Pati- 


3 Vgl. Christoph Molnar, Interpretable Machine Learning, New York 2020. 
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ent*innen verstehen können, warum diese Diagnose gestellt wurde. Eine intrans- 
parente „black box“-Diagnose ohne nachvollziehbare Erklärung wäre inakzeptabel 
und könnte zu schwerwiegenden Konsequenzen führen. 

In der Rechtswissenschaft ist die Erklärbarkeit ebenfalls von entscheidender 
Bedeutung. Wenn ein KI-Modell zur Entscheidungsunterstützung in Gerichtsver- 
fahren eingesetzt wird, müssen Richter*innen, Anwält*innen in der Lage sein, die 
Grundlagen dieser Entscheidungen zu verstehen und zu überprüfen. Dies ist not- 
wendig, um sicherzustellen, dass die Rechte und Interessen der Beteiligten gewahrt 
bleiben. 

Die Erklärbarkeit von KI-Modellen, insbesondere in der Ära großer Sprach- 
modelle, ist eine komplexe Herausforderung. Die Schwierigkeit, hochkomplexe 
„black box“-Modelle zu verstehen, birgt Risiken in sensiblen Anwendungsberei- 
chen. Dennoch sind Fortschritte bei der Erklärbarkeit entscheidend, um das Ver- 
trauen in KI-Systeme zu stärken und ihre Verwendung in wichtigen Anwendungs- 
gebieten zu ermöglichen. Durch die Entwicklung von Erklärungstechniken, 
interpretierbaren Modellen und verstärkter Transparenz können wir hoffentlich 
den Weg zu einer transparenten und verlässlichen KI-Zukunft ebnen. 


4 Förderung der Reproduzierbarkeit 


Die Reproduzierbarkeit von Forschungsergebnissen ist ein grundlegendes Quali- 
tätskriterium in der Wissenschaft. Sie ermöglicht es, die Ergebnisse wissenschaft- 
licher Arbeiten von anderen Forschenden unabhängig zu überprüfen und zu be- 
stätigen. In der Ära großer Sprachmodelle wie ChatGPT ist die Reproduzierbarkeit 
jedoch zunehmend erschwert. Innovative Ansätze und Lösungen sind erforderlich, 
um die Integrität und Glaubwürdigkeit der Forschung in diesem Bereich zu ge- 
währleisten. 


4.1 Transparenz im Trainingsprozess 


Eine der wichtigsten Maßnahmen zur Förderung der Reproduzierbarkeit besteht 
darin, den Trainingsprozess von Sprachmodellen transparenter zu gestalten. In 
vielen Fällen sind die genauen Details des Trainingsprozesses, einschließlich der 
verwendeten Daten, der Hyperparameter und der Architektur, nicht öffentlich 
verfügbar. Dies erschwert es anderen Forschenden, die gleichen Experimente 
durchzuführen und die Ergebnisse zu replizieren. 

Um diesem Problem zu begegnen, sollten Entwickler von Sprachmodellen die 
Trainingsprozesse dokumentieren und öffentlich zugänglich machen. Dies könnte in 
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Form von ausführlichen Trainingsprotokollen erfolgen, die alle relevanten Infor- 
mationen enthalten. Dazu gehören Details zur Datenpräparation, zur Auswahl der 
Hyperparameter und zur Architektur des Modells. Durch die Bereitstellung dieser 
Informationen können andere Forschende den Trainingsprozess nachvollziehen und 
die gleichen Bedingungen schaffen, um die Ergebnisse zu reproduzieren. 


4.2 Open-Source-Modelle 


Eine weitere wichtige Initiative zur Verbesserung der Reproduzierbarkeit besteht 
darin, Sprachmodelle als Open-Source-Projekte zur Verfügung zu stellen. Dies be- 
deutet, dass der Quellcode des Modells öffentlich zugänglich ist und von der Ge- 
meinschaft überprüft und erweitert werden kann. Open-Source-Modelle bieten 
mehr Transparenz und ermöglichen es der Forschungsgemeinschaft, den gesamten 
Modellstack zu überprüfen und anzupassen. 

Ein gutes Beispiel für ein Open-Source-Sprachmodell ist OpenAI GPT2. Nach 
anfänglichen Bedenken hinsichtlich Missbrauchsrisiken entschied sich OpenAl, den 
GPT2-Quellcode und die Modellgewichte der Öffentlichkeit zugänglich zu machen. 
Dies ermöglichte es der Forschungsgemeinschaft, das Modell zu analysieren, zu 
verbessern und neue Anwendungen zu entwickeln. Dieser Schritt förderte nicht nur 
die Reproduzierbarkeit, sondern auch die Zusammenarbeit und Innovation in der 
KI-Forschung. 


4.3 Standardisierte Benchmarks und Evaluationsverfahren 


Um die Reproduzierbarkeit in der KI-Forschung zu fördern, ist es wichtig, stan- 
dardisierte Benchmarks und Evaluationsverfahren zu etablieren. Dies bedeutet, 
dass bestimmte Datensätze und Metriken zur Evaluierung von Modellen in der 
gesamten Gemeinschaft akzeptiert und verwendet werden. Durch die Verwendung 
dieser standardisierten Maßstäbe können Forschende ihre Modelle auf den glei- 
chen Grundlagen testen, was die Vergleichbarkeit und Nachvollziehbarkeit erhöht. 

Ein Beispiel für einen solchen Standard ist der Penn Treebank-Datensatz, der 
oft in der natürlichen Sprachverarbeitung verwendet wird. Forschende können 
ihre Modelle anhand dieses Datensatzes testen und die Ergebnisse miteinander 
vergleichen, da eine gemeinsame Grundlage besteht. Die Schaffung und Förderung 
solcher Standards erleichtert es Forschenden, ihre Experimente zu replizieren und 
sicherzustellen, dass die Ergebnisse konsistent sind. 
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4.4 Datenzugang und Datentransparenz 


Neben der Transparenz im Trainingsprozess ist der Zugang zu den verwendeten 
Daten entscheidend für die Reproduzierbarkeit. Oftmals sind große Sprachmodelle 
auf umfangreiche Textdatenbanken angewiesen, um effektiv zu funktionieren. 
Forschende, die diese Modelle verwenden, sollten daher bestrebt sein, den Zugang 
zu den verwendeten Daten zu erleichtern. 

Eine Möglichkeit, den Zugang zu Daten zu fördern, besteht darin, offene und frei 
zugängliche Datensätze zu verwenden, die von der Forschungsgemeinschaft gepflegt 
werden. Dies ermöglicht es anderen Forschenden, auf die gleichen Daten zuzugreifen 
und ihre Experimente zu wiederholen. Wenn es notwendig ist, Daten aufgrund von 
Datenschutzbedenken zu beschränken, sollten Forschende alternative Wege zur 
Verfügung stellen, um auf aggregierte und anonymisierte Daten zuzugreifen. 


4.5 Reproduzierbarkeit als Teil der Forschungskultur 


Schließlich ist es wichtig, die Bedeutung der Reproduzierbarkeit als integralen 
Bestandteil der Forschungskultur zu betonen. Forschende sollten sich bewusst sein, 
dass die Fähigkeit, ihre Experimente zu replizieren und die Ergebnisse zu verifi- 
zieren, ein entscheidender Schritt zur Sicherung der wissenschaftlichen Integrität 
ist. Dies erfordert eine Kultur des Teilens von Ressourcen, Informationen und be- 
währten Praktiken. 

Konferenzen, Journale und wissenschaftliche Institutionen können ebenfalls 
dazu beitragen, die Reproduzierbarkeit zu fördern, indem sie Richtlinien und An- 
reize für transparente und reproduzierbare Forschung setzen. Dies könnte die 
Einreichung von reproduzierbaren Experimenten und das Teilen von Daten und 
Code als Voraussetzung für die Veröffentlichung von Forschungsarbeiten umfassen. 

Die Förderung der Reproduzierbarkeit in der Ära großer Sprachmodelle ist von 
entscheidender Bedeutung, um sicherzustellen, dass die Forschung in diesem Be- 
reich vertrauenswürdig und nachvollziehbar ist. Transparenz im Trainingsprozess, 
Open-Source-Modelle, standardisierte Benchmarks, Datenzugang und die Integra- 
tion von Reproduzierbarkeit in die Forschungskultur sind Schlüsselkomponenten, 
um dieses Ziel zu erreichen. Durch die Umsetzung dieser Maßnahmen können wir 
sicherstellen, dass die KI-Forschung auf einer soliden Grundlage steht und die Er- 
gebnisse für die gesamte wissenschaftliche Gemeinschaft zugänglich und nach- 
vollziehbar sind. 
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5 Verbesserung der Erklärbarkeit 


Die Erklärbarkeit von KI-Systemen, insbesondere von neuronalen Netzen, ist ein 
zentrales Anliegen in der Forschung und Entwicklung von Künstlicher Intelligenz. 
In der Ära großer Sprachmodelle, wie ChatGPT, stellt die Erklärbarkeit eine be- 
sondere Herausforderung dar. Diese Modelle sind aufgrund ihrer tiefen und kom- 
plexen Strukturen oft schwer nachvollziehbar. Dennoch gibt es verschiedene An- 
sätze und Techniken, um die Erklärbarkeit zu verbessern und sicherzustellen, dass 
Entscheidungen und Ergebnisse dieser Modelle besser verstanden werden können. 


5.1 Visualisierung von Entscheidungsprozessen 


Eine Möglichkeit, die Erklärbarkeit von KI-Modellen zu verbessern, besteht darin, 
Entscheidungsprozesse visuell darzustellen. Dies kann auf verschiedene Arten ge- 
schehen. Zum Beispiel könnten Heatmaps verwendet werden, um zu zeigen, welche 
Teile des Eingabe-Textes einen größeren Einfluss auf die generierte Ausgabe haben. 
Auf diese Weise können Forschende und Anwender erkennen, welche Informa- 
tionen für die Entscheidungsfindung des Modells am wichtigsten sind. 

Ein weiterer Ansatz ist die Visualisierung der Aktivierungen in den einzelnen 
Schichten des neuronalen Netzes. Dies ermöglicht es, zu verstehen, welche Arten 
von Mustern und Informationen in den verschiedenen Schichten des Modells auf- 
treten. Diese Visualisierungen können Aufschluss darüber geben, wie das Modell 
Informationen verarbeitet und welche Abstraktionsebenen es entwickelt. 

Darüber hinaus können t-SNE-Visualisierungen verwendet werden, um die Ver- 
teilung von Textdaten im Modellraum darzustellen. Dies ermöglicht es, ähnliche 
Textabschnitte zu identifizieren und zu verstehen, wie das Modell Texte gruppiert. 
Solche Visualisierungen können nützliche Einblicke in die Arbeitsweise des Modells 
bieten. 


5.2 Erklärungstechniken und Attributionsverfahren 


Eine Vielzahl von Erklärungstechniken und Attributionsverfahren ist entwickelt 
worden, um die Entscheidungsfindung von KI-Modellen zu beleuchten. Diese Ver- 
fahren zielen darauf ab, die Bedeutung einzelner Eingabe-Features oder -Token für 
die Ausgabe des Modells zu quantifizieren. Hier sind einige wichtige Ansätze: 
Grad-CAM (Gradient Class Activation Mapping): Grad-CAM ist eine Technik, die 
in der Bildverarbeitung weit verbreitet ist und auf Textdaten angewendet werden 
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kann. Sie zeigt, welche Teile des Eingabetextes zur Entscheidung einer bestimmten 
Klasse beitragen. Dies ermöglicht es, zu verstehen, welche Textstellen für die Mo- 
dellausgabe am einflussreichsten sind. 

LIME (Local Interpretable Model-Agnostic Explanations): LIME ist ein Modell- 
agnostisches Verfahren, das auf maschinellem Lernen angewendet werden kann. Es 
generiert eine erklärliche Näherung des Modells, indem es zufällige Perturbationen 
auf die Eingabedaten anwendet und die Auswirkungen auf die Ausgabe beobachtet. 
Dadurch kann LIME wichtige Eingabe-Features identifizieren. 

SHAP (SHapley Additive exPlanations): SHAP ist ein mathematisches Konzept 
aus der Spieltheorie, das auf die Erklärung von Modellentscheidungen angewendet 
wird. Es ermöglicht eine konsistente und faire Zuordnung der Bedeutung von 
Features in einem Modell. SHAP-Werte können verwendet werden, um zu verste- 
hen, wie sich die Anwesenheit oder Abwesenheit von Wörtern im Eingabetext auf 
die Modellausgabe auswirkt. 


5.3 Interpretierbare Modelle 


Eine vielversprechende Möglichkeit, die Erklärbarkeit von KI-Modellen zu erhöhen, 
besteht darin, Modelle zu entwickeln, die von Natur aus interpretierbarer sind. Dies 
kann bedeuten, auf komplexere, tiefere neuronale Netze zu verzichten und statt- 
dessen flachere Modelle zu verwenden. Solche Modelle sind zwar weniger leis- 
tungsstark, bieten jedoch eine höhere Erklärbarkeit. 

Beispielsweise könnten Entscheidungsbäume oder Regelbasierte Modelle ein- 
gesetzt werden. Diese Modelle sind transparent und nachvollziehbar, da sie klare 
Regeln für Entscheidungen liefern. Obwohl sie möglicherweise nicht die gleiche 
Leistungsfähigkeit wie tiefe neuronale Netze aufweisen, sind sie in bestimmten 
Anwendungsbereichen, insbesondere solchen, bei denen rechtliche oder ethische 
Erwägungen eine Rolle spielen, äußerst nützlich. 


5.4 Kombination von Ansätzen 


In vielen Fällen ist es sinnvoll, verschiedene Erklärungstechniken und Ansätze zu 
kombinieren, um ein umfassendes Verständnis für die Arbeitsweise eines KI-Mo- 
dells zu erhalten. Zum Beispiel könnten Visualisierungen dazu beitragen, grobe 
Muster und Trends aufzuzeigen, während Attributionsverfahren die Feinheiten der 
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Entscheidungsfindung verdeutlichen. Durch die Kombination von Ansätzen können 
Forschende ein tieferes Verständnis für die Modellentscheidungen entwickeln.* 


5.5 Die Bedeutung der Erklärbarkeit in sensiblen 
Anwendungsbereichen 


Die Verbesserung der Erklärbarkeit von KI-Modellen ist von entscheidender Be- 
deutung, insbesondere in sensiblen Anwendungsbereichen wie Gesundheitswesen, 
Recht und Finanzen. In diesen Bereichen ist es unerlässlich, dass Entscheidungen 
von KI-Systemen nachvollziehbar sind und erklärt werden können. Patient*innen 
müssen verstehen können, warum ein medizinisches Diagnosesystem eine be- 
stimmte Empfehlung gibt, Anwält*innen müssen die Grundlage für rechtliche 
Entscheidungen verstehen, und Finanzexpert*innen müssen die Faktoren hinter 
Anlageempfehlungen verstehen können. 

Die Erklärbarkeit von KI-Systemen trägt auch dazu bei, Vertrauen in diese 
Technologien aufzubauen. Wenn Menschen verstehen können, wie ein KI-System zu 
seinen Entscheidungen kommt, sind sie eher bereit, diese Entscheidungen zu ak- 
zeptieren und zu vertrauen. 

Die Verbesserung der Erklärbarkeit von KI-Modellen, insbesondere großer 
Sprachmodelle wie ChatGPT, ist eine Herausforderung, aber auch eine Notwen- 
digkeit. Durch die Anwendung von Visualisierungen, Erklärungstechniken, inter- 
pretierbaren Modellen und einer Kombination dieser Ansätze kann die Wissen- 
schaftscommunity dazu beitragen, die Entscheidungsfindung von KI-Systemen 
transparenter zu gestalten. Dies ist entscheidend, um das Vertrauen in diese Sys- 
teme zu stärken und sicherzustellen, dass sie verantwortungsbewusst und effektiv 
eingesetzt werden können. Die Erklärbarkeit bleibt ein Schlüsselaspekt bei der 
Gestaltung der Zukunft der Künstlichen Intelligenz. 


6 Fazit 


In einer Zeit, in der Künstliche Intelligenz und insbesondere große Sprachmodelle 
wie ChatGPT die Grenzen des Möglichen in der natürlichen Sprachverarbeitung 


4 Marco Tulio Ribeiro/Sameer Singh/Carlos Guestrin, „Why Should I Trust You? Explaining the 
Predictions of Any Classifier“, in Proceedings of the 22nd ACM SIGKDD International Conference on 
Knowledge Discovery and Data Mining, New York 2016, 1135-1144. 
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verschieben, stehen Forschende vor einer Vielzahl von Herausforderungen, die sich 
auf die Reproduzierbarkeit und Erklärbarkeit von Forschungsergebnissen auswirken. 

Die Reproduzierbarkeit von Forschungsergebnissen ist ein Grundpfeiler der 
wissenschaftlichen Methode. Sie ermöglicht es, die Ergebnisse wissenschaftlicher 
Arbeiten von anderen Forschenden unabhängig zu überprüfen und zu bestätigen. 
Ohne Reproduzierbarkeit sind wissenschaftliche Erkenntnisse nicht glaubwürdig 
und zuverlässig. In der Ära großer Sprachmodelle ist die Reproduzierbarkeit jedoch 
zunehmend gefährdet, da diese Modelle oft nicht öffentlich zugänglich sind und auf 
externen Servern betrieben werden. Die Abhängigkeit von externen Modellen und 
Diensten bedeutet, dass Forschende nicht die volle Kontrolle über die experimen- 
telle Umgebung haben. Dies wiederum erschwert die Nachvollziehbarkeit von 
Forschungsergebnissen erheblich. Um dieses Problem anzugehen, sollten Modelle 
wie ChatGPT als Open-Source-Projekte angeboten werden, bei denen der Trai- 
ningsprozess und der zugrunde liegende Code transparent dokumentiert sind. Dies 
würde Forschenden die Möglichkeit geben, den Trainingsprozess zu verstehen und 
sicherzustellen, dass sie konsistente Modellversionen verwenden. Darüber hinaus 
könnten standardisierte Benchmarks und Evaluationsverfahren entwickelt wer- 
den, um die Vergleichbarkeit von Forschungsergebnissen zu verbessern. 

Die Erklärbarkeit von Entscheidungen und Ergebnissen ist ein weiterer 
Schlüsselaspekt, der in der Ära großer Sprachmodelle an Bedeutung gewinnt. Ins- 
besondere Modelle, die auf komplexen neuronalen Netzwerken basieren, sind oft 
als „black box“ bekannt. Dies bedeutet, dass es schwer nachvollziehbar ist, warum 
ein bestimmter Text generiert wurde oder welche internen Gewichtungen und 
Muster zu einer bestimmten Entscheidung geführt haben. 

Die Herausforderung der Erklärbarkeit wird besonders kritisch, wenn es um 
den Einsatz solcher Modelle in sensiblen Anwendungsbereichen geht, wie etwa in 
der Medizin, im Rechtswesen oder in der Ethik. In diesen Bereichen ist es ent- 
scheidend, dass Entscheidungen nachvollziehbar sind, um Vertrauen und Akzep- 
tanz zu gewinnen. 

Um die Erklärbarkeit zu verbessern, müssen Forschende Methoden entwickeln, 
um die Entscheidungsfindung komplexer Modelle besser zu verstehen. Dies kann 
die Entwicklung von Erklärungstechniken umfassen, die es ermöglichen, die in- 
ternen Entscheidungsprozesse von Modellen wie ChatGPT nachzuvollziehen. Solche 
Techniken könnten auf Visualisierungen, Aufschlüsselungen von Gewichtungen 
und Einflüssen bestimmter Eingaben basieren. 

Ein vielversprechender Ansatz zur Verbesserung der Erklärbarkeit könnte 
auch darin bestehen, Modelle zu entwickeln, die von Natur aus interpretierbarer 
sind. Obwohl komplexe neuronale Netze beeindruckende Leistungen erbringen 
können, sind sie oft schwer verständlich. Modelle mit einer höheren Erklärbarkeit 
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könnten in Anwendungsbereichen eingesetzt werden, in denen die Nachvollzieh- 
barkeit der Entscheidungen von entscheidender Bedeutung ist. 

Die Ära großer Sprachmodelle bringt zweifellos viele Möglichkeiten und Po- 
tenziale mit sich, die die menschliche Kommunikation und Kreativität revolutio- 
nieren können. Dennoch müssen wir diese Technologien mit Bedacht einsetzen und 
die damit verbundenen Herausforderungen ernst nehmen. 

Es ist von entscheidender Bedeutung, dass Beteiligte in Wissenschaft, Ent- 
wicklung und Industrie, die große Sprachmodelle wie ChatGPT verwenden, sich 
ihrer Verantwortung bewusst sind. Dies schließt die Verpflichtung zur Förderung 
von Reproduzierbarkeit und Erklärbarkeit ein. Nur wenn wir diese Prinzipien 
einhalten, können wir sicherstellen, dass die Ergebnisse und Anwendungen dieser 
Modelle transparent, verlässlich und ethisch vertretbar sind. 

Insgesamt müssen wir in der wissenschaftlichen Gemeinschaft und darüber 
hinaus eine offene Diskussion über die Herausforderungen und Chancen führen, 
die mit großen Sprachmodellen verbunden sind. Dieser Diskurs sollte die Ent- 
wicklung von Best Practices, Ethikrichtlinien und Gesetzen zur Regulierung dieser 
Technologien unterstützen. 

Die Ära großer Sprachmodelle hat das Potenzial, die Art und Weise, wie wir mit 
Text und Sprache interagieren, grundlegend zu verändern. Doch dieser Fortschritt 
bringt auch erhebliche Herausforderungen mit sich, insbesondere in Bezug auf 
Reproduzierbarkeit und Erklärbarkeit. Diese Herausforderungen sollten als Chan- 
cen betrachtet werden, die es zu bewältigen gilt, um sicherzustellen, dass wir die 
Vorteile dieser Technologien verantwortungsbewusst nutzen. 

Die Förderung von Reproduzierbarkeit und Erklärbarkeit sollte zu einem 
zentralen Anliegen in der KI-Forschung und -Entwicklung werden. Indem wir 
transparente Praktiken etablieren, offene Diskussionen führen und innovative 
Lösungen entwickeln, können wir sicherstellen, dass große Sprachmodelle wie 
ChatGPT nicht nur leistungsfähig, sondern auch vertrauenswürdig und ethisch 
vertretbar sind. 


Bei der Erstellung dieses Beitrags wurden die Textgeneratoren OpenAl ChatGPT und 
Google Bard verwendet. Der Inhalt des Beitrags liegt jedoch in der alleinigen Ver- 
antwortung des Autors. 


II Kunst und Kreativität 


Jenifer Becker 

Können Chatbots Romane schreiben? Der 
Einfluss von KI auf kreatives Schreiben und 
Erzählen 


Eine literaturwissenschaftliche Bestandsaufnahme 


Abstract: Currently, the subject of artificial intelligence is increasingly becoming an 
ongoing focus of research in literary studies, due to the rise of Large Language 
Models such as ChatGPT. Extensive scholarly work, institutional connections, and 
research projects are just beginning to emerge. This article provides an overview of 
the present state of the discussion on artificial intelligence regarding the subject of 
literature and takes stock ofrelevant research desiderata. How is literature written 
by Al currently defined? What research questions arise from the establishment of AI 
in the literary market? And how is authorship renegotiated through Al literature? 
Perspectives from research into writing processes that consider the influence of AI 
on creative writing and storytelling will constitute the primary focus of the essay. 


In Karl Schroeders Science-Fiction-Roman Lady of Mazes aus dem Jahr 2005 über- 
schüttet eine künstliche Intelligenz die Menschheit mit Abermillionen von außer- 
gewöhnlich gut geschriebenen Romanen. Es sind so viele, dass sie unmöglich in 
einer einzigen Lebenszeit gelesen werden könnten - ein unerschöpfliches Kontin- 
gent an Geschichten, die präzise auf individuelle Präferenzen zugeschnitten sind. 
Seit der Veröffentlichung von ChatGPT scheint dieses Szenario, in dem uns eine KI 
fortwährend mit hyperindividualisierten Romanen versorgt, nicht mehr unvor- 
stellbar: Durch die Popularisierung großer Sprachmodelle vervielfältigen sich KI- 
geschriebene Inhalte exponentiell im Internet. Darunter auch literarische Texte, 
von Lyrik über Sci-Fi-Novellen, Krimis und Kinderbücher bis hin zu Ratgebern, 
Selbsthilfe- oder Sachliteratur.! ChatGPT ist nicht die einzige (Co-)Autor:in, die zu- 
nehmend in Veröffentlichungslisten erscheint — neben dem Unternehmen OpenAI 
stellen auch andere Unternehmen große Sprachmodelle (Large Language Models) 


1 Anthony Cuthbertson, „Hundreds of Al-written books flood Amazon“, The Independent, 2023 in 
[wwwindependent.co.uk/tech/ai-author-books-amazon-chatgpt-b2287111.html] (Zugriff: 02.09.2023). 


8 Open Access. © 2024 bei den Autorinnen und Autoren, publiziert von De Gruyter. Dieses Werk ist 
lizenziert unter einer Creative Commons Namensnennung - Nicht kommerziell - Keine Bearbeitung 4.0 International 
Lizenz. https:/doi.org/10.1515/9783111351490-007 
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der Öffentlichkeit zur Verfügung, darunter Google (Bard) oder auch Meta (LlaMA).” 
KlI-gestützte Schreibprogramme verbessern sich stetig und versprechen eine nied- 
rigschwellige Teilhabe an literarischer Textproduktion und Manuskriptoptimie- 
rung. Als „Maschine“, die Text produziert, überarbeitet und in Umlauf bringt, üben 
große Sprachmodelle Einfluss auf verschiedene Felder der gegenwärtigen Literat- 
urproduktion, -distribution und -rezeption aus und rücken damit neue For- 
schungsdesiderata ins Zentrum der Literaturwissenschaften. In welcher Weise 
fordern KI-Texte gängige literaturtheoretische, rezeptions- und produktionsästhe- 
tische Perspektiven heraus? Und wohin sollten Literaturwissenschaftler:innen ih- 
ren Blick richten? 

Zu diesem Zeitpunkt ist Künstliche Intelligenz (KI) eine noch wenig beleuchtete 
Größe in der literaturwissenschaftlichen Forschung, zu der sich, im Anschluss an 
Perspektiven zu generativer und digitaler Literatur, die jeweiligen Subdisziplinen 
gerade fortwährend entwickeln. Ziel dieses Beitrags ist es, einen Überblick über den 
aktuellen Diskussionsstand zu KI und Literatur zu geben und eine Bestandsauf- 
nahme der sich neu herausbildenden Forschungsdesiderata durchzuführen. Dazu 
werde ich vier verschiedene Dimensionen der Literaturwissenschaft beleuchten, 
auf die sich KI aktuell am eindringlichsten auswirkt: 1) Gattung (Was ist KI-Lite- 
ratur?), 2) Literaturbetrieb (Welche Relevanz hat schreibende KI für den Litera- 
turmarkt?), 3) Schreibprozesse (Wer nutzt KI und wie kann KI zum literarischen 
Schreiben genutzt werden?) und 4) Autor:innenschaft (Wie verändern sich Autor: 
innenschaftskonzepte vor dem Hintergrund künstlich generierter Texte?). Der Fo- 
kus soll dabei auf literarischen Bereichen liegen, die aufgrund der Einflussnahme 
von KI eine genauere Analyse oder Beobachtung erfordern. Dazu werde ich Dis- 
kurse zu KI aus den Literaturwissenschaften aufgreifen, ebenso Online-Diskurse, 
die das Themenfeld behandeln, da ein Großteil der Sondierungen hinsichtlich 
möglicher Effekte und Auswirkungen von KI gegenwärtig im digitalen Raum statt- 
findet. Darüber hinaus werde ich eigene Beobachtungen einfließen lassen, dieich in 
den vergangenen Jahren als Literaturwissenschaftlerin und Autorin im Rahmen 


2 Neben den USA wird gegenwärtig vor allem in China in die Entwicklung von LLMs investiert. 
Demgegenüber stehen verschiedene globale Entwicklungsvorstöße von Privatfirmen und For- 
schungsinstitutionen (vgl. Paul Fraioli, „Large language models: fast proliferation and budding in- 
ternational competition“, The International Institute for Strategic Studies, 2023, in [wwwiiss.org/de- 
DE/publications/strategic-comments/2023/large-language-models-fast-proliferation-and-budding-in 
ternational-competition/] (Zugriff: 02.09.2023). Einen Überblick über Funktionsweisen und den ge- 
genwärtigen Stand relevanter LLMs geben Naveed et al. in ihrem Paper A Comprehensive Overview 
of Large Language Models (Humza Naveed et al., „A Comprehensive Overview of Large Language 
Models“, Journal of LaTex, 2023, in [wwwarxiv.org/pdf/230706435.pdf] (Zugriff: 02.09.2023). 
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meiner Forschungsbemühungen zum Themenkomplex „Literarisches Schreiben 
und Erzählen mit KI“ machen konnte. 


1 Eine Genealogie der KI-Literatur und die 
Entwicklung KI-gestutzter Schreibverfahren 


2018 machte der Autor und Programmierer Ross Goodwin mit einem vermeintlich 
schreibenden Cadillac auf sich aufmerksam. Im Kofferraum des Cadillacs befand 
sich ein künstliches neuronales Netzwerk (KNN), das auf Grundlage eines Text- 
korpus und GPS-Daten literarische Miniaturen generierte. Mithilfe eines Druckers 
fügte sich auf der Fahrt von New York nach New Orleans in Echtzeit ein Road-Novel 
zusammen.’ 1 the Road wird mitunter als erster öffentlichkeitswirksamer KI-Ro- 
man kanonisiert.* Es handelt sich hierbei nicht um einen linear aufgebauten Ro- 
man, der gängigen erzählerischen Schemata entspricht, sondern um eine experi- 
mentelle Zusammenführung von Wetterdaten, Raststätten-Reviews und 
Satzsplittern aus Sci-Fi-Narrativen. Trotz des experimentellen Sprachgebrauchs 
markierte 1 the Road einen großen Schritt in der künstlichen Genese literarischer 
Texte, der Literaturwissenschaftler Debarshi Arathdar sieht diesen insbesondere 
darin, dass 1 the Road Kohärenz auf Satzebene aufweist.’ Auch in anderen Genres 
lassen sich in der zweiten Hälfte der 2010er Jahre erste KI-Publikationserfolge 
verzeichnen. Vorstöße in Richtung KI-Lyrik unternahm 2016 Google in Kooperation 
mit der Universität Stanford. In einem gemeinsamen Forschungsprojekt wurde ein 
rekurrierendes Sprachmodell mit 11.000 Romanen trainiert, um anschließend Ge- 
dichte zu generieren.° 2017 publizierte ein chinesischer Verlag den vermeintlich 


3 Connor Goodwin schlüsselt in einem Beitrag im BOMB Magazine die Verfahrensweisen hinter 1 
the Road auf. Connor Goodwin, „A.I. Storytelling: On Ross G’s 1 the Road“, BOMB Magazine, 2016, in 
[www.bombmagazine.org/articles/ross-goodwins-I-the-road/] (Zugriff: 18.08.2023). 

4 Der Journalist Thomas Hornigold kennzeichnet beispielsweise 1 the Road als ersten KI-Roman, 
was von verschiedenen Online-Medien aufgegriffen wird (vgl. Thomas Hornigold, „The First Novel 
Written by AI Is Here—and It’s as Weird as You’d Expect It to Be“, Singularity hub, 2018, in [https:// 
tip.de/340jb] (Zugriff: 02.09.2023). Ebenso wird auf der Verlagsseite unter „about“ darauf hinge- 
wiesen, dass es sich bei 1 the Road um das erste richtige Buch handele, das von einer KI geschrieben 
wurde: „1 the Road offers the first real book written by an AI, which captures us from the first page, 
when the journey begins“ in [wwwijbe-books.com/products/1-the-road-by-an-artificial-neural] (Zu- 
griff: 02.09.2023). 

5 Debarshi Arathdar, „Literature, Narrativity and Composition in the age of Artificial Intelligence“, 
TRANS, 2020, 7. 

6 BookCorpus wurde als Trainingsdatensatz genutzt (vgl. Samuel R. Bowman et al., ,Generating 
sentences from a continuous space“, CONLL, 2015). 
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ersten KI-Gedichtband,’ generiert über das Programm Microsoft Little Ice (Xiao- 
ice).® Im Filmbereich wird Sunspring,” ebenfalls von Ross Goodwin, als erstes, von 
einer Künstlichen Intelligenz geschriebenes, Drehbuch verhandelt. Experimentelle 
KI-Literatur, wie K Allado-McDowells Pharmako-AI,*° erhielt 2020 noch wenig 
Aufmerksamkeit — 2023 wird dahingegen die Krimi-Novelle Death of an Author von 
Aidan Marchine im Dunst des ChatGPT-Hypes von der New York Times rezensiert.'" 

Die Genealogie von KI-Literatur wird momentan in Echtzeit entworfen. Wer im 
Oxford Dictionary of Literature nach „Al-Lit“ sucht, wird vielleicht einen Eintrag 
dazu finden - zu dem Zeitpunkt, an dem dieser Artikel verfasst wurde, existiert er 
jedoch noch nicht. Vor dem Hintergrund erzählerischer Errungenschaften aus der 
Computerlinguistik” bleibt die Frage offen, ob 1 the Road wirklich als Geburts- 
stunde des ersten KI-Romans gelten sollte, oder ob es sich nicht vielmehr um eine 
öffentlichkeitswirksame Rekontextualisierung von Methoden der vorausgehenden 
Computerlinguistik und Automatic Story Generation” handelt. Daran schließt sich 
die Frage, was unter Künstlicher Intelligenz im literarischen Zusammenhang 
überhaupt zu verstehen ist. Subsumiert werden unter dem aufgeladenen Begriff 
Verfahren der natürlichsprachlichen Textgenese (NLG)'* mit KNN. Literatur, die mit 


7 People’s Daily Online berichtete am 31.05.2017 über den ersten KI-Gedichtband, der von Microsoft 
mitentwickelt und vom chinesischen Verlag Cheers Publishing herausgegeben wurde (vgl. Jiang Jie, 
„First Al-authored collection of poems published in China“, People’s Daily Online, 2017, in [http://en. 
people.cn/n3/2017/0531/c90000-9222463.html] (Zugriff: 18.08.2023). 

8 Xiaoice, The Sunshine Lost Windows, Beijing Cheers Publishing House, 2017. 

9 Sunspring wurde verfilmt und gewann einen Preis bei einem Filmfestival. Archiviert wurde der 
Film beispielsweise auf YouTube (Ross Goodwin, „Sunspring“, YouTube/Ars Technica, 2016, in [www. 
youtube.com/watch?v=LY7x2Ihqjmc&ab_channel=ArsTechnica]) (Zugriff: 02.09.2023). 

10 K Allado-McDowell & GPT-3, Pharmako-AlI, New York 2020. 

11 Dwight Garner, ,A Human Wrote This Book Review. A.I. Wrote the Book“, The New York Times, in 
[www.nytimes.com/2023/05/01/books/aidan-marchine-death-of-an-author.html] (Zugriff: 02.09.2023). 
12 Einen Überblick über literarische Erzählverfahren und sog. Storymaschinen aus der Compu- 
tational Linguistik mit Fokus auf Erzählungen geben Mike Sharples und Rafael Perez y Perez in 
Story Machines - How Computers Have Become Creative Writers, London/New York 2022. 

13 Einen Überblick über verschiedene Ansätze in der natürlichsprachlichen Textgeneration (Na- 
tural Language Generation (NLG)) mit Fokus auf das Erzählen von Geschichten fasst Aqil Azmi 
zusammen (Aqil Azmi, „Automatic Story Generation: A Survey of Approaches“, ACM Comput. Surv, 
Bd. 100(7) 2021, Art. 8). 

14 Natural Language Generation (NLG) ist ein Teilgebiet der Linguistik und Computerwissenschaft, 
insbesondere der Forschung zur künstlichen Intelligenz, mit dem Ziel, natürliche Sprache über 
Computer generieren zu lassen. Seit den 2010er Jahren haben sich Machine-Learning-Modelle zur 
Genese oder Auswertung natürlicher Sprache etabliert. Insbesondere künstliche neuronale Netz- 
werke (KNN) sind hierbei relevant, vgl. Yoav Goldberg, „A Primer on Neural Network Models for 
Natural Language Processing“, Journal of Artificial Intelligence Research, 2015, 345-420. Bei künst- 
lichen neuronalen Netzwerken handelt es sich um Computersysteme, die vorgeblich die Funkti- 
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künstlichen neuronalen Netzwerken erstellt wurde, wird in den Literatur- und 
Medienwissenschaften gegenwärtig an der Schnittstelle zwischen generativer und 
digitaler Literatur diskutiert." Pionierarbeit bei der Definition und Historisierung 
von KI-Literatur im deutschsprachigen Raum leistete der Autor, Literatur- und 
Medienwissenschaftler Hannes Bajohr. Um die Bandbreite digitaler Schreibprakti- 
ken’® zu differenzieren und Verfahrensweisen mit künstlichen neuronalen Netz- 
werken abzugrenzen, ordnet Bajohr KI-Literatur aus einer medientechnologischen 
Perspektive ein. Er grenzt KI-Literatur als Teil des konnektionistischen Paradigmas 
von einem sequenziellen Paradigma ab.’ Bajohr spricht in diesem Zusammenhang 
von einem Schreiben „dritten Grades“:’* Literatur mit künstlichen neuronalen 
Netzwerken zu erzeugen heißt, zunächst ein Textkorpus zu definieren (Material- 
zusammenstellung), mit dem das Modell trainiert wird, um anschließend Text zu 
generieren, auf den - von der Promptmodellierung abgesehen - kein Einfluss 
ausgeübt wird. Die Kulturwissenschaftlerin und Philosophin Mercedes Bunz weist 
darauf hin, dass diese Form des generativen Schreibens Form priorisiert und 


onsweise des Gehirns nachahmen und mit verbundenen Einheiten arbeiten, die als künstliche 
Neuronen bezeichnet werden (vgl. Zheng Rong Yang/Zhang Yang, Comprehensive Biomedical Phy- 
sics, Stockholm 2022). Künstliche neuronale Netzwerke, die in der Lage sind, natürliche Sprache zu 
erzeugen, werden durch Machine und Deep Learning trainiert und basieren auf Textdatensätzen. 
15 Digitale Literatur wird auch anhand der Begriffe Computational oder Electronic Literature 
diskutiert und in einer eigenen poetologischen Tradition verortet, die mitunter bis hin zu mittel- 
alterlichen Schreibapparaturen zurückverfolgt wird (vgl. Nancy Katherine Hayles, Electronic Lite- 
rature: New Horizons for the Literary, Cambridge 2009; Scott Rettberg, Electronic Literature, Cam- 
bridge 2019; Philipp Schönthaler, Die Automatisierung des Schreibens und Gegenprogramme der 
Literatur, Berlin 2022; Hannes Bajohr, Schreibenlassen — Texte zur Literatur im Digitalen, Berlin 
2022). 

16 Die Verfahrensweisen digitaler Literatur sind vielfältig. Einen Überblick geben z.B: Caroline 
Lamb et al., „A taxonomy of generative poetry Techniques“, Journal of Mathematics and the Arts, 
Bd. 3, 2017; Judith van Stegeren/Mariet Theune, „Narrative Generation in the Wild: Methods from 
NaNoGenMo“, Proceedings of the Second Storytelling Workshop, 2019, 65-74; Christina Linardaki, 
»Poetry at the first steps of Artificial Intelligence“, Humanist Studies & the Digital Age, 2022). 

17 Hannes Bajohr fasst die Produktionsweisen nach dichotomen Paradigmen zusammen: ,,Das 
sequentielle Paradigma der generativen Literatur [...] arbeitet mit linearen Algorithmen, das kon- 
nektionistische Paradigma [...] basiert auf neuronalen Netzen.“ Unter dem sequenziellen Paradigma 
fasst Bajohr Texte zusammen, die „als eine Abfolge von Regelschritten ausgeführt werden“ (Hannes 
Bajohr, „Algorithmic Empathy - On Two Paradigms of Digital Generative Literature and the Need for 
a Critique for AI Works“, Media Culture and Cultural Techniques Nr. 4, 2020, 10). 

18 Hannes Bajohr kategorisiert die Grundelemente digitaler Literatur anhand der folgenden 
Phanomene: Schreiben in Distanz, Materialverarbeitung und Konzeptumsetzung. In Bezug auf das 
Schreiben mit großen Sprachmodellen spricht Bajohr darüber hinaus von einem Schreiben „dritten 
Grades“ (Hannes Bajohr, Schreiben in Distanz, Hildesheim 2023, 51). 
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stochastisch operiert.** Die Definition, Ausmessung und Kartographierung von KI- 
Literatur geschieht nicht nur aus strikt wissenschaftlicher Perspektive, sondern 
auch in Form poetologischer Selbstbetrachtungen, bei denen die Aufschlüsselung 
der Methodik und des Konzepts zum Teil der künstlerischen Arbeit wird, wie dies 
beispielsweise im Textkollektiv 0x0a” oder in Mattis Kuhns Selbstgespräch mit ei- 
ner KI” geschieht. 

Vor dem Hintergrund von ChatGPTs menschenähnlichen Sprachfähigkeiten 
ähneln Projekte wie Selbstgespräche mit einer KI dem Stammeln einer Maschine, 
die gerade erst begonnen hat zu sprechen. Eine absurde Road-Novelle aus der Feder 
von ChatGPT ist keine nerdige Nischenliteratur mehr, hat aber auch ihren Zauber 
als drollige Maschinenliteratur mittlerweile verloren. Auch wenn aktuell nicht ge- 
klärt ist, wie und in welchem Ausmaß Chatbots Schreiben und Schreibkompetenzen 
verändern werden, dringt die Textmaschine KI doch stetig in verschiedene Bereiche 
des literarischen Feldes ein: Die kontinuierliche Erweiterung von (literarischem) 
KI-Content sowie Errungenschaften hinsichtlich textbasierter Technologien ver- 
schieben somit auch die bisherigen Konventionen des Marktes. 


2 Literaturökonomische Perspektiven: KI auf dem 
Literaturmarkt 


Nach der Veröffentlichung von ChatGPT im November 2022 wird von einer kaum 
kontrollierbaren Flut von KI-Texten im Internet gesprochen, darunter auch KI-Bü- 
cher, die insbesondere den Online-Versandhändler Amazon betreffen. Das US- 
amerikanische Sci-Fi- und Fantasy-Literaturmagazin Clarksworld nahm im Februar 
2023 aufgrund eines rapiden Anstiegs an Einsendungen, die mithilfe von KI verfasst 
wurden, keine neuen Texte mehr an.” Der Washington-Post-Reporter Will Oremus 
schreibt: „Al-written content spreading across the web as new language software 


19 „Generated writing is writing whose orientation puts form before facts and operates stochas- 
tically.“ (Mercedes Bunz, „Thinking through generated writing“, MediArXiv, 23.06.2023, 17, in [www. 
mediarxiv.org/4th3x] [Zugriff: 10.09.2023]). 

20 Hannes Bajohr/Gregor Weichbrodt, 0x0a, in [www.0x0a.li/de/] (Zugriff: 19.08.2023). 

21 Mattis Kuhn, „Selbstgespräche mit einer KI“, 0x0a, 2020-2021, in [www0x0a.li/de/neuer-titel- 
selbstgespraeche-mit-einer-ki/] (Zugriff: 19.08.2023). 

22 Vincent Acovino/Halimah Abdullah, „Sci-Fi magazine stops submissions after flood of AI gene- 
rated stories“, NPR, 23.02.2023, in [wwwnprorg/2023/02/23/1159118948/sci-fi-magazine-stops-submissi 
ons-after-flood-of-ai-generated-stories] (Zugriff: 18.08.2023). 
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allows anyone to rapidly generate reams of prose on almost any topic.“ Hierbei 
handele es sich, so Oremus, um KI-generierte Produkt-Reviews, Rezepte und Blog- 
posts. Er weist ebenso darauf hin, dass digital angekündigte Sachbücher kurz vor 
ihrem eigentlichen Erscheinen durch KI repliziert wurden. Die KI-Replikate er- 
schienen unter gleichem Titel wie die angekündigten Sachbücher, wiesen jedoch 
keine inhaltliche Tiefe auf.”* Dies sind nur einige Beispiele für die vielzitierte Spitze 
des Eisbergs unkontrollierbarer Contentpluralisierungen durch Chatbots. ChatGPT 
hat darüber hinaus innerhalb kürzester Zeit einen Markt hervorgebracht, der 
darauf abzielt, Wissen zur optimalen Nutzung von Chatbots (zum Beispiel Verfei- 
nerung von Prompts) entweder frei verfügbar oder kostenpflichtig zu verbreiten. 
Literarische Textproduktion wird mitunter durch Tutorials beschleunigt. Online 
verfügbare Schritt-für-Schritt-Anleitungen zur Erstellung von Büchern mit ChatGPT 
scheinen literarisches Schreiben aus seinem Elfenbeinturm zu holen. Schreibpro- 
gramme, die Workflows beschleunigen und Personal einsparen sollen, breiten sich 
aus. Darunter auch Programme, die versprechen, Bücher schnell und effizient zu 
schreiben und diese auf den Literaturmarkt zu bringen. Laut der Beratungs- und 
Forschungsagentur Verified Market Research beläuft sich der Wert des US-ameri- 
kanischen Markts für KI-Schreib-Software im Jahr 2021 auf 818,48 Millionen US- 
Dollar. Es wird prognostiziert, dass er bis zum Jahr 2030 auf einen Wert von 
6.464,31 Millionen, und damit um fast 27 Prozent, ansteigt.” Es mehren sich in 
diesem Zusammenhang auch Textfeedbackprogramme, die Lektoratstätigkeiten 
ersetzen und das eigene Romanmanuskript optimieren sollen. 

Auch wenn derzeit okkult anmutende Werbeversprechen den KI-Programm- 
Markt dominieren, verspricht der Einsatz von KI eine ernstzunehmende Optimie- 
rung des Verlagswesens. Dies betrifft sowohl eine verbesserte Datenverarbeitung 
(z.B. zur Zielgruppenanalyse oder Search Engine Optimization) als auch eine Ver- 
änderung des Lektoratsprozesses selbst.”* Gemeint ist hier eine mögliche Auto- 
matisierung von Lektoratsschritten durch KI-gestützte Programme, die auch in der 
Lage sind, Textfeedback zu Struktur, Spannungsaufbau oder sprachlichen Inkohä- 


23 Will Oremus, „He wrote a book on a rare subject. Then a ChatGPT replica appeared on Amazon“, 
The Washington Post, 05.05.23, in [www.washingtonpost.com/technology/2023/05/05/ai-spam-websi 
tes-books-chatgpt/] (Zugriff: 18.08.2023). 

24 Oremus 2023. 

25 Verified Market Research, 2023, in [wwwverifiedmarketresearch.com/product/ai-writing-assi 
stant-software-market/] (Zugriff: 02.09.2023). 

26 Die angeführten Punkte entsprechen denen, die in Online-Diskursen zu KI und Verlagswesen 
primär aufgegriffen werden (vgl. zum Beispiel Writerful Books, „How is AI Changing the Book 
Publishing Industry“, in [wwwwriterfulbooks.com/ai-authors-book-editors-publishers/] (Zugriff: 
02.09.2023). 
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renzen zu geben. Das Programm LiSA der Firma QualiFiktion wirbt beispielsweise 
damit, belletristische Texte hinsichtlich ihrer Stimmung, ihrer Figuren oder ihres 
Leser:innenpotenzials zu analysieren. Ebenso bietet das System Vergleiche mit 
Bestsellern an.” Bisher werden diese Phänomene online diskutiert und kaum 
wissenschaftlich aufgearbeitet. Es ist unklar, ob jene Programme tatsächlich das 
Lektorat auch innerhalb von Verlagsstrukturen nachhaltig verändern können oder 
ob von diesen Tools lediglich ein trügerisches Versprechen von Publikationserfolgen 
ausgeht. Ebenso steht eine Nutzungsanalyse aus, die fundiert erfasst, wie und in 
welchen Bereichen KI von Verlagen bereits eingesetzt wird und welche wirt- 
schaftlichen Vor- oder Nachteile daraus resultieren.”* 

Während KI im Verlagswesen und Lektorat noch ein randständiges Phänomen 
ist, wird Text in einschlägigen Textmärkten bereits standardmäßig von künstlichen 
neuronalen Netzen generiert, wie beispielsweise im Copy Writing (Marketing), zur 
Erstellung von Captions (Bildunterschriften) oder kürzeren Textformen im Jour- 
nalismus.”° Zudem wird von verschiedenen Seiten eine mögliche Umwälzung des 
Arbeitsmarktes durch KI prognostiziert, von der auch Jobs im literarischen Feld 
betroffen sind.” Denkbar wäre eine Verlagerung hin zu einer stärker kuratorischen 
Arbeitsweise: Anstatt Texte zu schreiben, müssten diese geprompted und sortiert 
bzw. arrangiert werden. Zu untersuchen, welchen Effekt KI schließlich auf Berufe 
im literarischen bzw. schriftstellerischen Feld ausübt, fällt auch in den Bereich der 
(transdisziplinären) Literaturwissenschaften. 


27 Eine Beschreibung möglicher Features findet sich auf der Website des Unternehmens (Quali- 
Fiction, in [www.qualifiction.info/lisa/lisa-f%C3%BCr-verlage/] (Zugriff: 02.09.2023). 

28 Im Wintersemester 23/24 werde ich mit Masterstudierenden am Literaturinstitut Hildesheim 
literarische Manuskripte mit KI-gestützten-Programmen auswerten, um klarer einschätzen zu 
können, wie Textfeedbackprogramme in literarische Prozesse integriert werden können und in- 
wiefern dies auf dem aktuellen Stand der Technik sinnvoll ist. 

29 Der Journalist John Herrman listet in einem Artikel Vorstöße in Bezug auf KI und Journalismus 
auf und nennt US-amerikanische Magazine und Zeitungen, die bereits mit KI arbeiten (vgl. John 
Herrman, „How Will Artificial Intelligence Change the News Business?“, Intelligencer, 2023, in [www. 
nymag.com/intelligencer/2023/08/how-ai-will-change-the-news-business.html] [Zugriff: 02.09.2023]). 
30 Das World Economic Forum prognostiziert: „[...] while expectations of the displacement of 
physical and manual work by machines has decreased, reasoning, communicating and coordinating 
- all traits with a comparative advantage for humans - are expected to be more automatable in the 
future. Artificial intelligence, a key driver of potential algorithmic displacement, is expected to be 
adopted by nearly 75% of surveyed companies and is expected to lead to high churn - with 50% of 
organizations expecting it to create job growth and 25% expecting it to create job losses“ (World 
Economic Forum, Future of Jobs Report, 2023, 5). 
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3 Schreibprozessforschung: Kollaboratives 
Schreiben und KI-gestttzte Tools in 
literarischen Schreibprozessen 


Am 2. Mai 2023 trat die Writers Guild of America (WGA) in den Streik. Einer der 
Streikpunkte betraf die Regulierung des Einsatzes von künstlicher Intelligenz. Ge- 
fordert wird eine gesetzliche Regelung, die Modellen wie ChatGPT lediglich eine 
Rolle als Recherche- und Konzeptualisierungswerkzeug erlaubt, Drehbuch-Autor: 
innen jedoch von dem restlosen Austausch mit künstlichen neuronalen Netzwerken 
bewahrt.” Der geforderte Anti-AI-Paragraph spiegelt die grundlegende Skepsis ge- 
genüber KI wider und greift die vieldiskutierte Frage auf, ob menschliche Autor: 
innen an Relevanz verlieren, wenn KI vermeintlich kreative Tätigkeiten über- 
nimmt. Aktuell sind sich Künstlerinnen, Autor:innen und Wissenschaftler:innen 
jedoch weitgehend einig — und ich schließe mich dieser Meinung an - dass es keine 
autonom agierende KI geben kann, die gänzlich ohne menschliche Beteiligung 
auskommt: Es besteht stets die Notwendigkeit eines kollaborativen Elements. Dies 
wird bereits am Trainingskorpus großer Sprachmodelle sichtbar; aktuell bestehen 
Trainingsdaten vornehmlich aus menschlich geschriebenen Texten. Ebenso ist der 
Textoutput immer hochgradig vom Textinput abhängig. Hannes Bajohr spricht in 
diesem Zusammenhang davon, dass künstlerische Durchbrüche immer in einem 
Dialog zwischen Mensch und Maschine stattfinden.?” Zu ergründen, wie jene Kol- 
laborationen aussehen können und wie genau Sprachmodelle (literarisches) 
Schreiben verändern, ist Gegenstand der Schreibprozessforschung. 

Das Literaturinstitut Hildesheim hat 2020 angefangen, den Lehr- und For- 
schungsschwerpunkt Schreiben und KI dezidiert zu etablieren, damit verbunden die 
Entwicklung von Forschungsperspektiven, die Einrichtung von Lehr- und For- 
schungsprojekten sowie eine Einbindung des Themenfelds ins Curriculum.” Diese 


31 WGA on Strike, „The Campaign“, WGAcontract, in [www.wgacontract2023.org/the-campaign/wga- 
negotiations-status-as-of5-12023] (Zugriff: 02.09.2023). 

32 In einem Interview mit João Gabriel Ribeiro spricht Hannes Bajohr von ,,eine[r] Assemblage aus 
Mensch und Maschine, in der Kunst das Ergebnis eines Dialogs zwischen beidem ist“ (João Gabriel 
Ribeiro/Hannes Bajohr, „Nur eine schwache künstliche Intelligenz kann wirkliche Neuheit vor- 
bringen“, Goethe-Institut-Portugal.de, 2023, in [www.goethe.de/ins/pt/de/kul/zuk/aut/22442745.html] 
(Zugriff: 02.09.2023). 

33 Vorstöße in die Integration des Themenfeldes digitale Literatur sowie digitale Schreib- und 
Leseweisen hat Dr. Guido Graf geleistet. Die Implementierung von Kl und Schreiben haben Prof. Dr. 
Dagmara Kraus und ich durch verschiedene (Lehr-)Initiativen und Projekte erwirkt (vgl. in [www. 
uni-hildesheim.de/literaturinstitut/schreiben-mit-ki/] (Zugriff: 02.09. 2023)). 
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Bestrebungen lassen sich in verschiedenen Fachbereichen beobachten, auch 
Schreibinstitute setzen sich vermehrt mit dem Themenfeld auseinander.* Analy- 
siert werden beispielsweise Schreibpraktiken mit KI. In Bezug auf die literarische 
und erzählerische Arbeit mit künstlichen neuronalen Netzwerken lassen sich fol- 
gende Verfahrensweisen clustern: Die Systeme können entweder selbst trainiert 
werden, indem sie mit einem vergleichsweise kleinen, manuell ausgewählten Da- 
tensatz gefüttert werden - das ist beispielsweise noch mit GPT-2 möglich; es kann 
aber auch ein bereits trainiertes System verwendet und „feingetuned“ werden. State 
of the Art der vortrainierten Systeme sind gegenwärtig große Sprachmodelle wie 
ChatGPT, LLaMA oder Bard. Auf Basis meiner bisherigen Forschung operationali- 
siere ich kollaborative Verfahren zur Genese von erzählender Literatur mit KI 
anhand von drei Schritten: 1) Konzeption, 2) Textproduktion, 3) Überarbeitung.” 
Diese lassen sich entweder im Dialog mit Chatbots oder in KI-gestützten Program- 
men, die sich auf Fiction Writing spezialisiert haben, umsetzen. 

Bisher gibt es nur begrenzt Daten zu literarischen Schreibprozessen mit KI, 
diese können mitunter über Werkstattgespräche, künstlerische Forschung oder die 
Auswertung von Erfahrungsberichten gesammelt werden. Material bietet bei- 
spielsweise der Blog der Independent-Autorin Jennifer Lepp, die eine Fantasy-Kri- 
mi-Reihe auf Amazon Self Publishing vertreibt und beschreibt, wie sie durch den 
Einsatz eines KI-gestützten Programms ihre Produktivität verzehnfacht hat.’ Ma- 
gic‘s a Hoot war der erste Roman, den Lepp 2021 unter dem Pseudonym Leanne 
Leeds in Kollaboration mit dem KI-gestützten Programm Sudowrite schrieb. Su- 
dowrite wird aktuell im Netz als funktionalstes KI-gestütztes Schreibprogramm zur 
Prosagenese gehandelt. Lepps Arbeitsprozess erscheint hochgradig operationali- 
siert und ist auf maximalen Output angelegt. Aufgaben werden zwischen Programm 
und Autorin delegiert, Konzeptions- und Überarbeitungsabläufe folgen einem 
gleichbleibenden Schema. In einem Interview mit The Verge räumt sie ein, dass sie 
sich — besonders in der Anfangsphase der Kollaboration mit Sudowrite - mental 
stark von ihrer Geschichte entfernte und teilweise den Zugang zu ihren Figuren 


34 Aktuell entstehen vermehrt Forschungsarbeiten und wissenschaftlich-künstlerische Arbeiten 
zum Themenfeld KI und Literatur (vgl. Jenifer Becker, „Dear GPT-3: Collaborative Writing with 
Neural Nets“, in Artificial Intelligence — Intelligent Art: Human Machine Interaction and Creative 
Practice, hg. von Robin Auer et al., Bielefeld 2024; Jenifer Becker, „Die Suche nach dem perfekten Ex: 
Prosaversuche mit Künstlichen Neuronalen Netzwerken“, in Quatschmaschine, hg. von Bernhard 
Dotzler, Bielefeld 2023). 

35 Jenifer Becker, „Zukunftsutopie oder -dystopie. Kreatives Schreiben mit KI. Teil 1 & 2“, w/k - 
Zwischen Wissenschaft und Kunst, 2023, in [www.wissenschaft-kunst.de/zukunftsutopie-oder-dyst 
opie-kreatives-schreiben-mit-ki-ii/] (Zugriff: 18.08.2023). 

36 Leanne Leeds, „Deciding to try Sudowrite“, leanneleeds.com, 2021, in [wwwleanneleeds.com/initi 
al-sudowrite-page/#more-4039] (Zugriff: 02.09.2023). 
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oder logischen Zusammenhängen verlor. Lepp beschreibt diesen Prozess als einen 
didaktischen, der die richtige Balance zwischen Delegation und Eigenverantwor- 
tung in der Zusammenarbeit mit Sudowrite erfordert.” Die Arbeitsweise der Au- 
torin deutet auf eine Zukunft hin, in der Schreiben - insbesondere im Unterhal- 
tungssektor — kein individueller Akt mehr sein wird, sondern ein hoch 
professionalisierter Kollaborationsprozess von menschlichen Akteur:innen und 
künstlichen neuronalen Netzwerken. 

Neben dem Einfluss von KI auf Schreibverfahren sollten auch KI-gestützte 
Programme als solche dringend zum Gegenstand der Analyse gemacht werden. 
Sowohl im Trainingskorpus als auch im Interface von Schreibprogrammen ist stets 
eine spezifische Vorstellung von Literatur und literarischen Formen erkennbar, die 
kritisch eruiert werden muss. Betrachten wir beispielsweise Sudowrite: In dem 
Programm lassen sich verschiedene schriftstellerische Arbeitsschritte automati- 
sieren, eine Erzählung kann über eine Makro- oder Mikrostruktur in Kooperation 
mit KI konzipiert und umgesetzt werden. Mit der Story Engine können seit 2023 
ganze Romane oder Drehbücher generiert werden. Sudowrite implementiert dafür 
Schreibansätze aus der konventionellen Drehbuchtheorie, sichtbar an Begriffen wie 
„Beats“ oder „Plot Points“, die mitunter auf Syd Field” oder Blake Snyder’? zu- 
rückgehen und auf modellhaftem Erzählen aufbauen. Lassen wir das System 
weitgehend autonom arbeiten, entstehen geschlossene Geschichten mit hand- 
lungsgetriebenen Plots, die sich in einer schematischen 3- oder 5-Akt-Struktur ent- 
falten. Die im System angelegten Parameter können individuell bestückt werden, 
ebenso lassen sich bewusst Brüche einbauen, um die vorgegebene Struktur der 
Story-Engine-Geschichte subversiv zu unterlaufen, dies erfordert jedoch ein aktives 
Gegen-Schreiben. Je weniger eingegriffen wird, desto generischer ist der Output. 
Literarische Texte von Chatbots sind derzeit stark stereotypisiert, oft finden sich 
darin klischierte Beobachtungen und Beschreibungen, Figurencharakterisierungen 
sind eher schwach und verbleiben oberflächlich, insbesondere Dialoge klingen 
abstrakt und hölzern. Auch hier liegt das literarische Potenzial meiner Meinung 
nach vor allem in der Kollaboration. 

Neben einer Analyse von Schreibprogrammen müssen Trainingsdaten in eine 
kritische Analyse von Schreibprozessen integriert werden. Sudowrite basiert auf 
verschiedenen, „feingetunten“ Versionen von GPT3 und GPT-4. Welche Trainings- 
daten GPT-4 genau zugrunde liegen, ist nicht vollends geklärt. Wir können davon 
ausgehen, dass sich, neben einschlägigen Online-Enzyklopädien und Common- 


37 Josh Dzieza, „The Great Fiction of AI“, The Verge, 2022, in [wwwtheverge.com/c/23194235/ai-fic 
tion-writing-amazon-kindle-sudowrite-jasper] (Zugriff: 02.09.2023). 

38 Syd Field, Screenplay - The Foundations of Screenwriting, New York 1979. 

39 Blake Snyder, Save the Cat!: The Last Book on Screenwriting You'll Ever Need, London 2005. 
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Crawl-Datensätzen, auch literarische Texte im Korpus befinden. Ein Team von 
Wissenschaftler:innen der Universität Berkeley hat ein Paper veröffentlicht aus 
dem hervorgeht, welche literarischen Werke mit hoher Wahrscheinlichkeit Teil des 
Trainingskorpus von ChatGPT waren, darunter kanonisierte Werke wie die von 
Jane Austen, aber auch populäre Gegenwartsliteratur wie Harry Potter oder 50 
Shades of Grey. Ein Großteil der literarischen Texte, so die Studie aus Berkeley, setze 
sich zudem aus Sci-Fi-Literatur zusammen.” Auch hier ist ein kritischer Blick sei- 
tens der Literaturwissenschaft gefragt: Welchen Text-Output-Effekt erwirkt ein 
Trainingsdatensatz, welcher zu einem großen Teil aus kanonisierter, englisch- 
sprachiger Literatur besteht? Als Forschungsdesiderat steht zudem eine fundierte 
Analyse von Stil- und Sprachmustern aus: Kann eine Vereinfachung von Sprache 
beobachtet werden, und wie lässt sich einem aktuell zu beobachtenden englischen 
Sprachimperialismus in Modellen des westlichen Wirtschaftsraums entgegenwir- 
ken? Wenn Trainingsdatensätze irgendwann nur noch auf Kl-generierten Texten 
basieren, die fehlerhaft sind, könnte dies darüber hinaus dazu führen, dass der 
Output immer absurder, fehlerhafter, inkohärenter wird - in der Forschung wird 
hier auf einen möglichen Kollaps des Modells hingewiesen.** 

Ein breitgefächertes Forschungsfeld bietet zudem die kritische Analyse von 
Biases, die in literarischen Texten reproduziert werden. Verschiedene Studien 
weisen darauf hin, dass große Sprachmodelle Biases enthalten, die Diskriminie- 
rungsformen und Rassismen reproduzieren.” An diese Studien ließen sich litera- 
turwissenschaftliche Perspektiven anschließen. In eigenen Experimenten und in 
Zusammenarbeit mit Studierenden des Literaturinstituts Hildesheim konnte ich 
beobachten, dass in Erzählungen und Romanversuchen stets ähnliche Narrative 
reproduziert werden, die verstärkt Elemente der positiven Psychologie beinhalten. 
Es bleibt kritisch zu beobachten, welchen Einfluss KI-Erzählprogramme wie Su- 


40 Kent K. Chang et al., „Speak, Memory: An Archaeology of Books Known to ChatGPT/GPT-4“, arXiv, 
in [wwwarxiv.org/pdf/2305.00118.pdf] (Zugriff: 02.09.2023). 

41 Ilia Shumailovet al., ,The Curse of Recursion: Training on Generated Data Makes Models Forget“, 
arXiv, 2023, in [wwwarxiv.org/pdf/2305.17493v2.pdf] (Zugriff: 02.09.2023). 

42 Es wird darauf hingewiesen, dass semantische Strukturen im Output von Sprachmodellen 
analog zu jenen im Trainingskorpus verlaufen, vgl. Aylin Caliskan et al., „semantics derived auto- 
matically from language corpora contain human-like biases“, Science, 2017, 183-186; Abhishek 
Mandal, „The Algorithmic Origins of Bias“, FeministAl, 22.06.2021, in: [https://tlp.de/sq5ru] (Zugriff: 
19.08.2023). Darüber hinaus wurden in verschiedenen Studien rassistische sowie anti-semitische 
Biases, ebenso Diskriminierungen gegenüber Menschen mit Behinderungen nachgewiesen, vgl. Ari 
Schlesinger et al., „Let’s talk about race: Identity, chatbots, and AI“, Proceedings of the Conference on 
Human Factors in Computing, 2018, 1-14; Anhong Guo et al., „Toward fairness in Al for people with 
disabilities: A research roadmap“, Proceedings of the ASSETS Workshop on AI Fairness for People 
with Disabilities, 2019, 1-9. 
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dowrite auf das Geschichtenerzählen nehmen und ob sie zu einer noch stärkeren 
Reproduktion von durchaus ideologisch aufgeladenen Narrativen wie Campbells 
Heldenreise führen. 

Einige meiner Studierenden meinen, dass sie sich ein Schreiben ohne ChatGPT 
gar nicht mehr vorstellen können, weniger um Texte generieren zu lassen, als 
vielmehr um erste Ideen abzugleichen und einen Weg in den Schreibprozess zu 
finden. Ein Großteil der Schreib-Studierenden steht KI jedoch weiterhin skeptisch 
gegenüber. Dies bildet sich auch in Rezeptionshaltungen ab. In einem Interview mit 
dem Onlinemagazin The Verve spricht die Autor:in Jennifer Lepp von negativen 
Reaktionen der Leser:innen, die den Einsatz von KI als Schummeln wahrnehmen 
oder sich in gewisser Weise betrogen fiihlen.** Unter welchem Rezeptionsvertrag 
werden KI-Texte aktuell gelesen? Und wer hat sie nun eigentlich geschrieben - 
Nutzer:in oder ChatGPT oder OpenAl oder die Autorinnen, deren Romane, Er- 
zählbände und Lyrik ungefragt als Trainingsdaten eingespeist wurden? 


4 Autor:innenschaftskonzepte: Ist die Autor:in 
tot? 


Die Lektüre eines Romans unterliegt stets Paratexten, ebenso werden Geschichten 
durch Genre-Kennzeichnungen gelabelt, die verschiedene Leseerwartungen er- 
zeugen. Diese Mechanismen zeigen sich am eindrücklichsten an autobiografischen 
Texten: Wenn der autobiografische Pakt verletzt wird, erzeugt dies mitunter Kon- 
sequenzen, wie beispielsweise die öffentliche Diffamierung des Autors James Frey. 
Dass Freys 2003 veröffentlichte Memoiren A Million Little Pieces kaum auf auto- 
biografischen Erlebnissen fußte, löste eine Diskussion über ethische Implikationen 
autobiografischer Erzählweisen aus. Noch ungeklärt ist, ob und wie der Einsatz von 
Künstlicher Intelligenz in der Textgenese abgebildet werden soll, ob möglicherweise 
ein KI-Pakt analog zu Philipp LeJeunes autobiografischem Pakt denkbar wäre. Oder 
ob wir uns, wie es Hannes Bajohr beschreibt, bereits in einem postartifiziellen 
Zeitalter befinden, in dem die Distinktion zwischen maschinellen und menschli- 
chen Texten keine Relevanz mehr haben wird.* 

Diskutiert werden darüber hinaus Fragen zu Urheberrecht und Schöpfungs- 
höhe. Grundsätzlich sind KlI-generierte Texte nicht urheberrechtlich geschützt, da 
es sich nicht um persönliche, von Menschen gemachte Schöpfungen handelt. Der 


43 Dzieza 2023. 
44 Hannes Bajohr, „Artifizielle und postartifizielle Texte“, Sprache im technischen Zeitalter, 
Bd. 61(245), 2023, 37-61, 39. 
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Rechtsanwalt Sebastian Skradde weist darauf hin, dass bisher ungeklärt ist, ob und 
in welchem Maß Urheberrechte geltend gemacht werden können, wenn Texte ge- 
meinsam mit KI erzeugt werden.“ Grundsätzlich können Urheberrechtsrechte 
verletzt werden, wenn beispielsweise eine KI Textabschnitte plagiiert. 

Neben juristischen Fragestellungen werden vor allem Fragen nach literarischer 
Wertigkeit und Kommunikationsintentionen diskutiert. Was kann eine KI, die 
weder empfindungsfähig ist noch ein semantisches Verständnis hat, überhaupt 
Relevantes schreiben? Der Diskurs um KI und Literatur, aber auch um KI und 
künstlerische Produktion, wird maßgeblich von der Frage dominiert, ob KI 
menschliche Kreativität ersetzen kann.* Die Literaturwissenschaftlerin Stephanie 
Catani verweist in diesem Zusammenhang auf die diskursprägende Rolle von Me- 
dien in der vermeintlichen Vermenschlichung von KI: „Die stereotype Berichter- 
stattung über die Beteiligung von KI-Programmen an Kunstproduktionen ist [...] 
nicht folgenlos, sondern maßgeblich dafür verantwortlich, dass neuronale Netze 
und Algorithmen zu Künstlern der Zukunft erklärt werden.“*’ Hier spannt sich eine 
mitunter stark emotional aufgeladene Debatte auf, die ontologisch die Frage auf- 
greift: Was macht uns Menschen eigentlich menschlich, wenn uns die Kreativität 
abgenommen wird? Literaturtheoretische Konzepte, die aus einem strukturalisti- 
schen Verständnis entwachsen sind und sich gänzlich von Autor:innenintentionen 
abgrenzen, scheinen in den aufgeladenen Diskussionen von KI-Autor:innenschaft 
kaum berücksichtigt zu werden. Der Literaturwissenschaftler Andrew Dean plä- 
diert in diesem Zusammenhang für eine Fruchtbarmachung jener Ansätze, die 
textimmanente Fragestellungen priorisieren und weniger die Materialität einer 
menschlichen oder künstlichen Autor:innenfigur oder -intention in den Fokus rü- 
cken.“ Dean unterstreicht, dass die synthetische Qualität von KI-produzierter 
Sprache ein anderes Kreativitätsverständnis erforderlich mache als eines, das 
menschliche Rationalität oder Intention ins Zentrum rückt. Er verweist hierbei auf 
Perspektiven, die eine Intentionalität von Text ablehnen, wie William Kurtz Wim- 
satts und Monroe Beardsleys Überlegungen zu einem intentionalen Fehlschluss 


45 Sebastian Skradde, „Urheberrechtliche Aspekte von KI-generierten Texten — der Fall ChatGPT“, 
Anwalt.de, 2023, in [wwwanwalt.de/rechtstipps/urheberrechtliche-aspekte-von-ki-generierten-tex 
ten-der-fall-chatgpt210139.html] (Zugriff 02.09.2023). 

46 Die Fragestellung wird sowohl in internationalen Leitmedien, Reddit-Foren, Blogs als auch auf 
anderen Social-Media-Plattformen diskutiert. Mir begegnet die Frage zudem in Interviews und auf 
KI-Konferenzen, oft in Zusammenhang mit Begriffen wie „Originalität“, „Bewusstsein“ oder auch 
„Seele“. 

47 Stephanie Catani, „Gegenwartsliterarische Experimente mit Künstlicher Intelligenz“, in 
Schnittstellen, hg. von Andrea Bartl et al., Paderborn 2022, 247-266, 248. 

48 Andrew Dean, „Aland the Future of Literary Studies“, Sydney Review of Books, 2023, in [wwwsyd 
neyreviewofbooks.com/essay/future-literary-studies-dean/] (Zugriff: 02.09.2023). 


Können Chatbots Romane schreiben? —— 97 


oder Roland Barthes Textverständnis, das sich vermeintlichen Ursprüngen und 
intentionalen Zuschreibungen entzieht.”” Auch Michel Foucaults Was ist ein Autor? 
ließe sich als theoretische Grundlage für ein zugespitztes KI-Textverständnis nut- 
zen, in dem individuelle Autor:innenschaft möglicherweise gänzlich aufgelöst 
würde. In diesem Zusammenhang wird auch auf die Rolle von Rezipient:innen 
verwiesen, beispielsweise durch den Literaturwissenschaftler Debarshi Arathdar.°° 
Auch wenn KI-Texte Glitches, Fehler oder Lücken enthalten, werden diese im Re- 
zeptionsprozess kognitiv mit Bedeutung versehen. Wenn also eine KI einen ver- 
meintlich sinnentleerten Text generiert, kann dieser von uns mit eigenen Erinne- 
rungen und (Lese-)Erfahrungen aufgeladen; und damit im Rezeptionsprozess 
„vermenschlicht“ werden. In Rückgriff auf schreibtheoretische Positionen wie die 
von Jacques Derrida verweist auch Mercedes Bunz darauf, dass generierte Texte 
stets eine Relation zu unserer Lebenswelt aufweisen.” Eine stärkere Gewichtung 
von Rezeptionsperspektiven, die auch in der hermeneutischen Auslegung von al- 
gorithmischer Literatur zu beobachten ist, ermöglicht in diesem Sinne ebenfalls 
einen neuen Interpretationsraum für KI-generierte Texte. 

Die Skepsis gegenüber literarisch schreibender KI zeigt, dass die Rezeption li- 
terarischer Texte immer noch stark mit einem romantischen Geniekult verwoben 
ist - Literatur(-produktion) ist mit Erwartungen an die Figur der vermeintlich allein 
aus dem eigenen Geist schöpfenden Autor:in aufgeladen, ein Bild, das durch den 
Einsatz von Hilfswerkzeug oder Schreibassistenzen in Frage gestellt wird. In der 
Kunst, aber auch in der Literaturgeschichte, gibt es vielfältige Beispiele, anhand 
derer diese Thematik bereits diskutiert wurde. Man denke an Kunstformen wie Cut- 
ups oder kombinatorische Verfahren, bei denen weniger das Schreiben von Text- 
schnipseln als vielmehr das Arrangement und der Zufall zentrale Gestaltungsmittel 
sind. Die Trennung von Künstler:in und Produktion hat sich in der Bildenden Kunst 
darüber hinaus längst vollzogen: Dass Anne Imhoff oder Ai Weiwei Produktions- 
teams einsetzen, um ihre Ideen ausgestalten zu lassen, lässt niemanden an ihrem 
künstlerischen Status zweifeln. Ein Erstarken kollektiver Ansätze in der literari- 


49 „The arguments against intention span very different intellectual projects and histories, from 
Wimsatt and Beardsley’s essay on what they call ,the intentional fallacy‘ to Roland Barthes, for 
whom texts have ,no other origin than language itself, language which ceaselessly calls into question 
all origins‘.“, Dean 2023. 

50 „[...] the reader remains elemental in the role of grazing texts in that eternal pasture of her- 
meneutics that is fenced in only by context and cognitive limitations. It is human cognitive archi- 
tecture, with its capacity to bend, break, and blend, that accounts for all the sense-making and dis- 
junctures encountered while narrativizing.“, Arathdar 2020, 20. 

51 „Naturallanguage generation certainly does not align with our human artifice and its reality, but 
that does not mean that it has no relation to that reality.“, Bunz 2023, 17. 
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schen Praxis und Theorie” ließe sich in diesem Zusammenhang auch für eine 
Poetologie von KI-Kollaborationen fruchtbar machen. Der Einsatz von KI wäre im 
Kollektiv keine Bedrohung für die literarische Vermittlung menschlicher Lebens- 
welten, sondern möglicherweise ein produktiver Faktor in der Textgenese. 


5 Fazit 


In Lady of Mazes hat der plötzliche Überfluss an außergewöhnlich guter Literatur, 
die auf Knopfdruck von KI geschrieben wird, keinen Effekt auf die kreativen Am- 
bitionen der Erdbevölkerung. In Karl Schroeders Roman schreiben die Menschen 
trotzdem weiter, denn Kreativität ist - so Schroeder - das, was Menschen ausmacht 
und sie überhaupt erst menschlich werden lässt.” Was Maschinenkunst von 
menschlicher Kunst unterscheidet, ist jene Frage, die den Diskurs um KI und Kunst 
und auch im Spezifischen KI und Literatur gegenwärtig am eindringlichsten prägt. 
Da die Forschung zu Künstlicher Intelligenz rasante Fortschritte macht, sind es 
momentan vor allem Fragen, die in den Literaturwissenschaften gesammelt und 
gestellt werden. Richtungsweisend sind hierbei insbesondere Tagungen und Kon- 
ferenzen. Das Forschungsfeld Schreiben und KI beginnt sich zudem zu institutio- 
nalisieren, erkennbar an vielzähligen Forschungsprojekten oder neu gegründeten 
Forschungsstellen, wie beispielsweise das Kompetenzzentrum zum Schreiben mit 
Künstlicher Intelligenz an der Fachhochschule in Kiel unter Leitung von Doris 
Weßels. Es besteht fortwährend die Dringlichkeit, Klin das Curriculum angehender 
Literaturwissenschaftler:innen oder Schriftsteller:innen aufzunehmen. 
Abschließend kann ich aus meiner Forschungsexpertise zu Erzähl- und 
Schreibprozessen mit KI resümieren, dass ChatGPT ohne stärkeres Eingreifen noch 
keine außergewöhnlich originelle Literatur hervorbringt.°* Als Schreibtool bieten 


52 In den letzten Jahren sind einschlägige Bände zum kollektiven Schreiben im deutschsprachigen 
Raum entstanden: Daniel Ehrmann/Thomas Traupmann, Kollektives Schreiben, Paderborn 2022; 
Annette Pehnt/Guido Graf, Von Satz zu Satz, Hildesheim 2022. Zu beobachten ist zudem, dass mehr 
Schreibkollektive in Erscheinung treten, ebenso, dass kollaborative Arbeitsverfahren stärker ak- 
zeptiert werden. Das Konzept des Writers Room, das aus der Serien-, TV- und Filmwelt stammt, wirkt 
ebenfalls auf eine Normierung von kollaborativen Schreibverfahren ein. 

53 The UNESCO Courier, „AI and literature: is it really all for the best?“, The UNESCO Courier, 25.06. 
2018, in [www.unesco.org/en/articles/ai-and-literature-it-really-all-best-0] (Zugriff: 18.08.2023). 

54 Weitere Analysen und Evaluationen literarischer Schreibverfahren mit beispielsweise ChatGPT 
sind momentan vor allem in Online-Artikeln und Blog-Einträgen zu finden, z.B. Adi Robertson, „I 
tried the AI novel-writing tool everyone hates, and it’s better than I expected“, The Verge, 2023, in 
[wwwtheverge.com/2023/5/24/23732252/sudowrite-story-engine-ai-generated-cyberpunk-novella] 
(Zugriff: 17.08.2023); Robert Gonsalves, „Using ChatGPT as a Creative Writing Partner — Part 1: Prose. 
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KNN jedoch interessante Möglichkeiten der Kollaboration. Gleichzeitig muss be- 
rücksichtigt werden, dass sich KI für bestimmte Textformen und -felder aktuell 
besser eignet als für andere - stark schematisch aufgebaute Literatur, die bewusst 
mit generischer Sprache operiert, z.B. Groschenromane, ließen sich aktuell wahr- 
scheinlich problemlos mit KI umsetzen. Dennoch ist der Einsatz von KI beim 
Schreiben genauso abhängig von der Sprache, der Arbeitsweise und dem indivi- 
duellen Duktus einer Autor:in wie es beim solitären Schreiben der Fall ist. Noch ist 
unklar, wie stark Künstliche Intelligenzen das Schreiben revolutionieren werden 
oder ob wir uns immer noch in einem durch ChatGPT ausgelösten Hype befinden, 
der langsam in einer Ernüchterungswelle abflaut. Mit relativer Sicherheit lässt sich 
prognostizieren, dass sich Schreibarbeit mit KI-gestützten Tools weiter normali- 
sieren wird, so wie es bereits durch die Implementierung von Chatbots in Text- 
verarbeitungsprogrammen der Fall ist.°° Irgendwann wird es wahrscheinlich ab- 
surd sein zu sagen, dass ich mit einer Maschine kollaboriere, weil ich ein Kapitel 
eines Romans vom Präsens ins Präteritum umschreiben lasse. Bislang ist es Chat- 
GPT jedenfalls noch nicht gelungen, einen Bestseller zu schreiben, aber mögli- 
cherweise geschieht dies gerade in diesem Moment. 


How the latest language model from OpenAl can help write poetry, fiction, and screenplays“, to- 
wardsdatascience, 2023, in [https://tip.de/jcc53] (Zugriff: 17.08.2023); Vauhini Vara, „I didn’t know how 
to write about my sister’s death—so I had AI do it for me“, The Believer, 2021, in [wwwthebelievernet/ 
ghosts/] (Zugriff: 02.09.2023). 

55 Beispielsweise die „Help Me Write“-Funktion in Google.docs. 
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Eine technikphilosophische Exploration literarischer 
Möglichkeitsräume 


Abstract: We argue from a theological perspective that novels provide a fertile 
ground for fostering creative scenarios and thought experiments about Al creativity. 
Ian McEwan’s novel „Machines Like Me and People Like You“ serves as a basis for 
explorations of possible creativity of Al. In fiction, thinking can be even more ex- 
perimental, so the novel’s main characters inspire us to think through the question 
of AI creativity to an end. It is used as a springboard for examining AI creativity 
from literary and techno-philosophical perspectives. By drawing parallels between 
the novel’s concepts of AI Creativity and technological posthumanism, we explore 
the techno-philosophical implications that the novel constructs. Additionally, we 
highlight the role of subjectivity in AI systems and draw attention to the often 
overlooked and underpaid work of individuals from the Global South in AI systems 
and discussions surrounding autonomous/artificial/automated creativity. Our con- 
tribution seeks to offer new perspectives on the potential and challenges of AI 
creativity. 


1 Einleitung 


Neuroflash, Jasper, Creaitor.ai oder ChatGPT sind KI-gesttitzte Textgeneratoren und 
repräsentieren einige der jüngsten und spannendsten Entwicklungen auf dem Ge- 
biet der Künstlichen Intelligenz.' Obwohl die dahinterstehende Technologie - die 
Berechnung von Wahrscheinlichkeiten — recht einfach ist, basiert sie doch auf 
riesigen Datenmengen. Das große öffentliche Interesse an den Technologien lässt 
sich durch (teilweise berechtigte) Ängste vor dem Arbeitsplatzverlust, Allmachts- 
phantasien von KI oder durch damit verbundene Vergleiche zwischen Mensch und 
Maschine erklären, die durch entsprechende Entwicklungen geschürt zu werden 
scheinen. So äußert sich Olaf Zimmermann, der Geschäftsführer des Deutschen 
Kulturrates, wie folgt: „Maschinenlernen und KI werden massive Auswirkungen auf 
den Kultur- und Mediensektor haben. Sie bieten große Potenziale, aber sie haben 


1 Vgl. Mohammad Aljanabi, „ChatGPT: Future Directions and Open possibilities“, Mesopotamian 
Journal of Cybersecurity, 2023, 16-17. 


8 Open Access. © 2024 bei den Autorinnen und Autoren, publiziert von De Gruyter. Dieses Werk ist 
lizenziert unter einer Creative Commons Namensnennung - Nicht kommerziell - Keine Bearbeitung 4.0 International 
Lizenz. https:/doi.org/10.1515/9783111351490-008 
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Risiken für Menschen, die in Kulturunternehmen oder Kultureinrichtungen ar- 
beiten, Arbeitsplätze werden wegfallen, Tätigkeiten von Maschinen statt Menschen 
übernommen werden“.” Wir glauben, dass die hier angesprochenen Ängste, die u. a. 
mit dem Arbeitsplatzverlust zusammenhängen, insbesondere aus systemkritischer 
Perspektive besprochen werden sollten, da diese Entwicklungen auf wirtschaftlich 
orientierten Entscheidungen beruhen. Wir möchten uns in diesem Beitrag aber 
dem angesprochenen Vergleich zwischen Mensch und Maschine und somit zu- 
nächst den ontologischen Fragestellungen widmen, die wir ebenfalls als aus- 
schlaggebend für den Hype um Kl-gestützte Textgeneratoren betrachten. Was 
macht den Menschen zum Mensch und was macht die Maschine zur Maschine? Und 
wo verläuft die Grenze? 

So stellt sich aus philosophischer Perspektive nach — und zusammenhängend 
mit — der Frage: Kann eine KI intelligent sein? Auch: Kann eine KI kreativ sein? Der 
Deutsche Ethikrat (DER) schreibt in seiner Stellungnahme „Mensch und Maschine - 
Herausforderungen durch Künstliche Intelligenz“ 2023: 


Viel diskutiert und mit Blick auf KI von Relevanz ist auch der Zusammenhang von Intelligenz 
und Kreativität. Eine wichtige Rolle spielt hierbei die Unterscheidung zwischen konvergentem 
Denken, das durch logische Schlussfolgerungen zu einer einzigen oder besten Lösung gelangt, 
und dem für Kreativität charakteristischen divergenten Denken, das mehrere alternative Lö- 
sungen finden kann, die jeweils den gegebenen Anforderungen entsprechen.” 


So wie der DER in seiner Stellungnahme beziehen auch wir uns grundlegend auf 
einen bereits von Joy Paul Guilford geprägten Kreativitätsbegriff, welcher die in der 
Stellungnahme präsentierte Trennung zwischen konvergentem und divergentem 
Denken vertritt und Kreativität als flüssige, flexible und ursprüngliche Erzeugung 
von Lösungskonzepten für neuartige Probleme definiert.* 

Der Frage, ob eine KI kreativ sein kann, wollen wir in unserem Beitrag aus 
theologischer, literaturwissenschaftlicher und technikphilosophischer Perspektive 
nachgehen und uns dabei beispielhaft auf das kreative Schreiben beziehen. In 
diesem Zusammenhang beabsichtigen wir aufzuzeigen, dass Romane ein geeignetes 
Medium darstellen, um geistige Freiräume zu schaffen und explorative Szenarien 
zu eröffnen, um entsprechende Gedankenexperimente und Möglichkeitsabwä- 


2 Deutscher Kulturrat, „Künstliche Intelligenz: Welche Rolle spielt KI für die Kultur?“, Pressemit- 
teilung vom 03.04.2023, in [www.kulturrat.de/presse/pressemitteilung/kuenstliche-intelligenz-wel 
che-rolle-spielt-ki-fuer-die-kultur/] (Zugriff: 03.10.2023). 

3 Deutscher Ethikrat, Mensch und Maschine — Herausforderungen durch Künstliche Intelligenz. 
Stellungnahme, Berlin 2023, in [wwwethikrat.org/fileadmin/Publikationen/Stellungnahmen/ 
deutsch/stellungnahme-mensch-und-maschine.pdf], 13 (Zugriff: 03.10.2023). 

4 Vgl. Joy Paul Guilford, „Creativity“, American Psychologist, Washington D. C. 1950, 444-445. 
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gungen zu ermöglichen. In einem ersten Schritt bekräftigen wir diese These durch 
historisch-theologische Reflexionen zur Kontingenz und zur Entstehung des euro- 
päischen Romans. Anschließend erörtern wir die Potenzialität einer kreativen KI, 
exemplifiziert anhand des Romans Maschinen wie ich (2019) von Ian McEwan. 
Dieser Roman bietet sich an, da er die Perspektivenumkehr denkerisch ermöglicht: 
Die Menschen werden mit Maschinen verwechselt und umgekehrt. Schließlich 
werden wir unsere Hypothese, dass der Roman als geeignete Plattform für derartige 
Gedankenexperimente fungiert und die im Roman aufgeworfenen Konzepte in den 
Kontext technikphilosophischer Diskurse einordnen, vertiefen und abschließend 
abrunden. Spannend dabei ist, wie in der Fiktion die Kreativität von Klerklärt wird. 


2 Möglichkeitsräume, Kontingenz und der 
europäische Roman 


Im ersten Abschnitt arbeiten wir unsere These aus, dass sich Romane als Medium 
für das Eröffnen von Möglichkeitsräumen eignen, in denen sich Entwicklungen von 
KI untersuchen lassen. Dabei werden wir historisch-theologische Überlegungen zu 
der Entstehung des europäischen Romans in den Mittelpunkt unserer Überlegun- 
gen stellen. 

Bis zum 18. Jahrhundert prägte eine religiöse Sichtweise das Weltbild in großen 
Teilen Europas. Die christliche Lehre betonte u. a. die Vorherbestimmung des 
Menschen durch Gott und die Vorstellung, dass das Leben eines Menschen präde- 
terminiert sei. Die Menschen fügten sich in ihr göttliches Schicksal und akzeptierten 
mehr oder minder ihr Leben als Teil eines vorherbestimmen Plans. Mit der Auf- 
klärung im 17. und 18. Jahrhundert begann eine geistige Revolution, die traditionelle 
Glaubensvorstellungen in Frage stellte. Die Aufklärung betonte die wissenschaftli- 
che Methode und die Bedeutung der individuellen Erfahrung und Vernunft. Die 
Aufklärer:innen suchten nach rationalen Erklärungen für menschliches Verhalten 
und plädierten für die Freiheit des Einzelnen, sich von religiöser Bevormundung zu 
lösen. Eine Frage, welche die Theologie bis heute beschäftigt.’ 

In diesem Zeitalter der Aufklärung entstand auch der moderne europäische 
Roman, eine neue literarische Gattung. Romane erzählten Geschichten von indivi- 
duellen Charakteren, ihren Erfahrungen, Emotionen und Entscheidungen. Dieses 
Aufkommen wird nicht als zufällig betrachtet, so verweisen unterschiedliche Li- 
teraturwissenschaftler:innen auf einen Zusammenhang zwischen den Ideen der 


5 Vgl. Eberhard Schockenhoff, Theologie der Freiheit, Freiburg 2016. 
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Aufklärung des Menschen als autonomes, entscheidungsfähiges Wesen und den 
Narrativen des europäischen Romans.° 

Im europäischen Roman des 18. Jahrhunderts, exemplifiziert durch Werke wie 
Daniel Defoes Robinson Crusoe (1719), Samuel Richardsons Pamela; or, Virtue Re- 
warded (1740), Henry Fieldings Tom Jones (1749) und Laurence Sternes Tristram 
Shandy (1759), reflektiert sich die Erfahrung von Kontingenz in der Art und Weise, 
wie die Charaktere mit unerwarteten Ereignissen umgehen, wie sich ihre Lebens- 
geschichten entwickeln und wie ihre Entscheidungen ihre Schicksale beeinflussen. 
Kontingenzerfahrungen werden stark thematisiert. 

Unsicherheit und Unvorhersehbarkeit des Lebens sind zentrale Elemente, die 
in diesen Romanen adressiert werden. Anja Lemke beschreibt einen „Umstruktu- 
rierungsprozess von einem kosmologisch geschlossenen, theologisch-metaphysi- 
schen Weltbild zu modernen Modellen von Kontingenz im Zuge aufklärerischer 
Säkularisierung“,’ welcher sich auch in Romanen abbilde. Dabei gebe es eine 
doppelte Kontingenzbewältigung im Roman: 


Auf der einen Seite stellt der Roman selbst als Entwurf einer möglichen Welt die wirkliche Welt 
als eine bloß mögliche dar, d.h. er macht die Entstehung kontingenter Welten lesbar. Auf der 
anderen Seite lässt sich im fiktionalen Erzähltext eben die Entwicklung bzw. Bildung von In- 
dividualität beobachten, die im 18. Jahrhundert als Antwort auf den Umgang mit der in der 
Moderne einbrechenden offenen Zukunft in den Blick genommen wird.® 


Eine interessante Entwicklung in Bezug auf diese von Lemke genannte doppelte 
Kontingenzbewältigung und die Herausbildung von Individualität manifestiert sich 
in der Verlagerung von einer auktorialen Erzählperspektive, die oft eine ontolo- 


gisch-geschichtstheologische Totalitätsbestrebung ausdrückte, hin zu Varianten der 


Ich-Erzählung und der „first person narrative.’ Dies signalisierte nach Frick eine 


veränderte Intention des Erzählens im Zuge der Säkularisierung und Empirisie- 
rung. Anstelle eines metaphysischen Totalisierungskonzepts des barocken Ge- 


6 Vgl. John Richetti (Hg.), The Cambridge Companion to the Eighteenth-Century Novel, Cambridge 
1996. 

7 Anja Lemke, „Verhaltensdesign avant la lettre. Kontingenz und Potentialität im ‚Bildungs‘-Roman 
des 18. Jahrhunderts mit Blick auf Wilhelm Meisters Lehrjahre“, in Verhaltensdesign — Technolo- 
gische und ästhetische Programme der 1960er und 1970er Jahre, hg. von Jeannie Moser/Christina 
Vagt, Bielefeld 2018, 175-192, 175. 

8 Ebd., 181. 

9 Vgl. Werner Frick, Providenz und Kontingenz. Untersuchungen zur Schicksalssemantik im deut- 
schen und europäischen Roman des 17. und 18. Jahrhunderts, Tübingen 1988. 
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schichtsromans entstand ein gesteigertes Interesse an unmittelbaren Erfahrungen, 
Einzelschicksalen und ihrer psychologischen Intensität.'° 

So kann festgehalten werden: Das Erfahren von Kontingenz in den Lebens- 
realitäten während der Aufklärung führt zur Entstehung einer neuen Literatur- 
form, des modernen Romans, der genau diese Erfahrungen widerzuspiegeln ver- 
mag: Er erkundet kontingente Welten und Möglichkeiten des Lebens. Die neuen 
Möglichkeiten der individuellen Gefühls- und Handlungswelten können durch den 
Roman exploriert werden. Die Entstehung des europäischen Romans spiegelt den 
Übergang von einer Weltanschauung der Vorherbestimmung zu einer aufkläreri- 
schen Betonung der individuellen Erfahrung und der Bewältigung von Kontingenz 
wider. Nicht mehr alles vorbestimmt zu bekommen, sei es durch Gott oder durch 
andere Menschen, impliziert auch eine neue Freiheit, eine Freiheit von hin zu einer 
Freiheit zu, denken zu können. Und diese Möglichkeiten müssen erst erfahren 
werden, auch durch Romane, was diese zu einem bedeutenden Medium für die 
Erforschung neuer Entwicklungen macht. 

In der Tradition dieses Denkens möchten wir im Folgenden den Roman Ma- 
schinen wie ich (2019) des renommierten Schriftstellers Ian McEwan besprechen, 
welcher die neuen Möglichkeiten mithilfe von KI denkerisch illustriert. Im An- 
schluss an die Diskussion ausgewählter Möglichkeitsräume, die vom Autor aufge- 
zeigt werden, werden wir diese im nachfolgenden Abschnitt unter einer technik- 
philosophischen Perspektive verorten. 


3 Kreative KI? Am Beispiel von Ian McEwans 
Maschinen wie ich 


Maschinen wie ich - im Original Machines Like Me and People Like You - hat un- 
terschiedliche Diskussionen in der literaturwissenschaftlichen Forschung hervor- 
gerufen. Beispielsweise thematisieren Kopka und Schaffeld die vielschichtige Dar- 
stellung der KI-Ethik im Roman und betonen, dass McEwan es versteht, die Leser: 
innen zum Nachdenken über die Komplexität des menschlichen Handelns und der 
Moral anzuregen.“ Andere Wissenschaftler:innen beschäftigen sich auf Grundlage 


10 vgl. Ebd. 
11 Vgl. Katalina Kopka/Norbert Schaffeld, „Turing's Missing Algorithm: The Brave New World of Ian 
McEwan’s Android Novel Machines Like Me“, Journal of Literature and Science, Bd. 13(2), 2020, 53. 
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des Romans mit Fragen der Beziehung zwischen Mensch und Maschine,'” mit 
utopischen und dystopischen Narrativen über KI oder mit Fragen des guten Le- 
bens.'* 

Der Roman eröffnet gerade durch die Kombination von Vergangenheit und 
Narrativen der Zukunft gegenwärtige Themen, denn McEwan zeichnet die Ge- 
schichte des Zusammenlebens einer in einem anthropomorphen Roboter verkör- 
perten Künstlichen Intelligenz mit Menschen und lässt dieses Szenario nicht, wie 
üblich, in der Zukunft, sondern in einer alternativen Vergangenheit stattfinden, in 
der bestimmte Fakten und Ereignisse verändert wurden." Der Roman spielt in 
London des Jahres 1982. Mathematiker und Informatiker Alan Turing ist nicht früh 
gestorben, sondern hat die Wissenschaft und Entwicklungen technologischer Pro- 
dukte wie Internet, Handys, selbstfahrende Autos und Roboter maßgeblich beein- 
flusst und vorangebracht. Dies hat zur Folge, dass die im Roman gezeichnete Ver- 
gangenheit größere technologische Entwicklungen bzw fast schon 
Entwicklungssprünge vorzuweisen hat, als unsere Gegenwart. McEwan offenbart 
dabei einen Blick auf die Wissenschaftsgeschichte, die als Folge von Kontingenzen — 
genauer als Folge der kontingenten Lebensgeschichte — einzelner Subjekte ent- 
standen ist. Hätte Turing länger gelebt, hätte sich zumindest die technische Welt 
ganz anders entwickelt. 

Die KI mit dem Namen Adam wird im Roman, wie im Titel schon angedeutet, als 
(selbst-)bewusstes Subjekt verhandelt. Allerdings stellt sich die Frage: Kann diese KI 
kreativ sein? Wie wird das dargestellt und an welchen Kriterien festgemacht? 

In McEwans Roman ist die erste Frage definitiv mit Ja zu beantworten. In der 
zweiten Hälfte des Romans kann die KI Adam Haikus schreiben und scheint kreativ 
zu sein — kreativer als dessen Besitzer, der Mensch Charlie.'° Am Anfang wirken die 
Gedichte nicht sonderlich originell auf Charlie und könnten eventuell mit den 
heutigen Texten der KI-gestützten Textgeneratoren verglichen werden: 


Lyrik lieferte ein weiteres Beispiel für seinen Liebesüberschwang. Er hatte 2000 Haikus ge- 
schrieben und mir gut ein Dutzend davon vorgetragen, alle von ähnlicher Qualität, alle Mi- 


12 Vgl. Serena Obkirchner, „Machines like me and people like you‘ — Die Beziehung zwischen 
Mensch und Maschine in Ian McEwans Machines Like Me“, in Menschmaschinen / Maschinenmen- 
schen in der Literatur, hg. von Dunja Brötz et al., Innsbruck 2023, 153-170. 

13 Vgl. Tomasz Dobrogoszcz, „Do Cyborg Dream og (Becoming) People? The Alternative Non-Human 
Self in Ian McEwan's Machines Like Me“, in The Postworld In-Between Utopia and Dystopia, hg. von 
Katarzyna Ostalska und Tomasz Fisiak, Oxon 2021, 9. 

14 Vgl. Kerstin Schlögl-Flierl, „Gutes Leben zwischen Mensch und Maschine“, Stimmen der Zeit, 
Heft 7, 2020, 529-538. 

15 Vgl. ebd., 529. 

16 Vgl. Ian McEwan, Machinen wie ich, Zürich 2019, 192. 
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randa gewidmet. Anfangs interessierte es mich, zu welcher schöpferischen Leistung Adam 
fähig war, aber schon bald verlor ich das Interesse an dieser Gedichtform. Zu drollig, zu sehr 
darauf aus, nicht zu viel Sinn zu ergeben, zu gering die Herausforderung an den Autor, allzu 
leicht das Spiel mit hohlen Mysterien wie das Einhandklatschen. 2000! Die Zahl allein sagte 
alles - ein Algorithmus, der Haikus wie am Fließband produzierte." 


Beispiele Adams früherer Haikus sind: 


Ihr liebender Blick 
enthält eine ganze Welt. 
Drum liebe die Welt!*® 


Küsse jenen Raum, 
Den sie zum Fenster querte. 
Ihre Spur in der Zeit." 


Im weiteren Verlauf des Romans entwickelt Adam jedoch einen eigenen Stil und der 
Autor McEwan lässt den Protagonisten Charlie die künstlerische Leistung seiner 
gekauften KI anerkennen. Es ist sehr eindrucksvoll beschrieben, zu welch künst- 
lerischen Höhenflügen Adam im Laufe der Zeit fähig ist, vor allem, da er immer 
dazu lernt. Mit McEwan wird Kreativität am Schreiben von Lyrik festgemacht. 
Charlie ist von dieser ‚genialen‘ Fähigkeit beeindruckt, besonders da er zu Beginn 
noch die Einstellungen seiner KI modifizieren sollte. Charlie, als Besitzer, musste im 
Vorfeld diverse Einstellungen vornehmen: Wie hoch soll Adams Sensibilität sein? 
Wie stark ausgeprägt seine Fähigkeit, Humor zu zeigen? 

Das Endprodukt, das auch mit Hilfe der Freundin und Geliebten von Charlie 
noch weiter festgelegt wird, wächst aber über sich hinaus. 


Er hatte mit einem feinen Lächeln geredet, aber jetzt begann er zu lachen. Das war er also, sein 
erster Versuch, einen Scherz zu machen, und ich stimmte in sein Lachen ein. Ich war erschöpft 
und fand das alles plötzlich irrsinnig komisch. Als ich auf dem Weg ins Schlafzimmer an ihm 
vorbeiging, sagte er: „Aber im Ernst. Gestern Abend bin ich zu einer Entscheidung gelangt. Ich 
habe eine Möglichkeit gefunden, den Notschalter zu deaktivieren. Ist besser für uns alle.“”° 


Die KI schafft es, den für den Menschen, als Endnutzer, vorbereiteten Notschalter zu 
deaktivieren. Sie, die KI bestimmt also über sich selbst. Diese Selbstermächtigung 
über das festgelegte Geschehen stellt einen eindrucksvollen Beweis von Autonomie 
der KI dar. Trotz dieser Vorfestlegung kann die KI also kreativ sein. Und so kommen 


17 Ebd., 198. 
18 Ebd., 192. 
19 Ebd., 193. 
20 Ebd., 179. 


108 —— Paula Ziethmann/kerstin Schlögl-Flierl 


auch andere Formen der Kreativität auf, die sich nicht nur auf Literarisches be- 
schränken, beispielsweise die Deaktivierung des Notschalters oder - ein im Roman 
bei vielen KIs, wie Adam, auftretendes Phänomen - die Selbstabschaltung. Viele 
andere Adams und Eves hebeln den für den Menschen vorgesehenen Ausschalt- 
knopf aus. Manche begehen „Suizid“ oder versetzen sich in einen kognitiv wenig 
anspruchsvollen Zustand, werden also wieder zum Ding, da sie die Welt, so wie sie 
ist, nicht ertragen können. 

„Es sind lernende Maschinen, und wenn sie ihre Würde auf diese Weise be- 
haupten wollen, sollen sie das tun.“ Diese autonome Handlung setzt McEwan mit 
der eigenen Würdebehauptung gleich. Im Würdediskurs wird zwischen einem 
Zuschreibungsparadigma (Würde wird von außen zugeschrieben) und einem An- 
erkennungsparadigma (Würde hat die Person) unterschieden. Die KI, wie sie 
McEwan zeichnet, fällt eindeutig in die zweite Kategorie. 

Aus theologischer und philosophischer Sicht ergeben sich viele Anschlussfra- 
gen: Darf die KI, die nun Würde hat, nicht mehr abgeschaltet, also „getötet“ werden? 
Welche Rechte und Pflichten sind mit dieser Würde verbunden? 

Interessanterweise präsentiert die KI Adam die Form des Haikus in einer Zu- 
kunftsvision als die einzig wahre und verbleibende Version der Literatur. Er be- 
gründet dies mit der Vorstellung, dass die Zukunft das Ende aller Subjektivität 
bedeuten würde: 


Fast alles, was ich [Adam] in der Literatur der Welt gelesen habe, beschreibt Varianten 
menschlichen Versagens — mangelndes Verständnis, mangelnde Vernunft, mangelnde Weis- 
heit oder das Fehlen von echtem Mitgefühl. Versagen, was Erkenntnis betrifft, Ehrlichkeit, 
Freundlichkeit, Introspektion; glänzende Darstellungen von Mord, Grausamkeit, Habgier, 
Dummheit, Selbsttäuschung und vor allem von tiefen Missverständnissen im Hinblick auf 
andere. Natürlich zeigt sich auf Güte, und Heldenmut, Gnade, Weisheit oder Wahrheit. Aus 
diesem üppigen Wirrwarr erwuchsen ganze literarische Traditionen, blühten auf wie die 
Wildblumen in Darwins berühmter Hecke. Romane voller Spannungen, Heimlichkeiten, Ge- 
walt, voller Augenblicke der Liebe auch, und das formal perfekt ausgestaltet. Doch ist die 
Vereinigung von Männern und Frauen mit den Maschinen erst komplett, wird diese Art der 
Literatur überflüssig werden, da wir einander dann zu gut verstehen. Wir werden in einer 
geistigen Gemeinschaft leben und zu jedem Kopf unmittelbaren Zugang haben. Die Vernetzung 
wird so weit gehen, dass die individuellen Knotenpunkte der Subjektivität sich auflösen in 
einem Ozean von Gedanken, wofür das Internet nur ein kruder Vorläufer ist. Und da wir in den 
Köpfen aller leben werden, wird jede Verstellung unmöglich. Unsere Erzählungen kreisen 
nicht länger um endlose Missverständnisse. Unsere Literaturen verlieren ihren ungesunden 
Nährboden. Der lapidare Haiku, die stille, klare Wahrnehmung und Feier der Dinge, wie sie 
sind, wird die einzige, noch notwendige Form sein. Ich bin mir sicher, dass wir die Literatur der 
Vergangenheit weiterhin schätzen werden, selbst wenn wir sie mit Entsetzen lesen. Wir 
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werden zurückblicken und staunen, wie gut die Menschen von ehedem ihre eigenen Mängel zu 

beschreiben wussten, wie sie brillante, gar optimistische Fabeln aus ihren Konflikten zu stri- 

cken vermochten, aus monströsen Unzulänglichkeiten und gegenseitigen Missverständnis- 
22 

sen. 


Die Menschen würden sich mit Maschinen vereinen und so auch eine Verbindung 
zu jedem anderen Menschen aufbauen. Ein eigenständiges Bewusstsein würde es 
nicht mehr geben - das seit der Geburt bestehende Verlangen nach dem Ende der 
Einsamkeit wäre erfüllt. 

Das Ende aller Subjektivität bedeute jedoch auch das Ende des Bedarfs nach 
Empathie, das Ende jeglicher subjektiver Einzelbeschreibungen. Dies ist, nach 
Adam, das Ende des Romans, da jede Person bereits jede Perspektive auf Dinge 
kenne. Die einzige dann noch benötigte Form der Literatur sei folglich der Haiku, 
der mit seiner objektiven „Feier der Dinge, so wie sie sind“,”° die Welt so akzeptiere, 
wie sie ist, und die Intensität eines objektiven Moments in den Fokus stelle. So stellt 
die Künstliche Intelligenz Adam nicht nur sowohl den Haiku und den Roman als 
auch Objektivität und Subjektivität als gegenübergestellte Pole dar, sondern sich 
selbst, die Künstliche Intelligenz, als ein radikales Element der Antinarration. Damit 
ist der Roman als Ausdrucksmedium zu Ende. 

McEwan spielt in der untersuchten Passage mit dem Ende des Romans, dessen 
Entstehung wir im ersten Abschnitt nachgezeichnet haben. Dabei greift er genau die 
Elemente auf, die aus literaturwissenschaftlicher Perspektive bei der Entstehung 
des europäischen Romans ausgemacht wurden: Subjektivität und Kontingenz, 
welche in der Vision seines KI-Protagonisten Adam rein historisch existieren. Doch 
auch ohne Subjektivität existiert in dieser Vision nach wie vor Kreativität: Mit der 
vermeintlich objektiven Form der Literatur, dem Haiku. 


4 Einordnung in technikphilosophische Diskurse 


McEwan illustriert diverse interessante Möglichkeiten einer kreativen KI und be- 
leuchtet deren Voraussetzungen sowie Konsequenzen. Diese Möglichkeiten möch- 
ten wir in diesem Abschnitt in technikphilosophische Diskurse einordnen und 
diskutieren. Dabei liegt der Fokus insbesondere auf der im vorherigen Abschnitt 
ausführlich zitierten Vision der KI Adam. Diese Vision reiht sich u. a. in verbreitete 
Narrative des technologischen Posthumanismus ein. 


22 Ebd., 202-203. 
23 Ebd. 
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Es ist laut Janina Loh notwendig, den technologischen Posthumanismus vom 
Transhumanismus zu unterscheiden.’* Diese Differenzierung kann über eine Be- 
trachtung der Ziele erfolgen: Nach Loh besteht das Ziel des Transhumanismus 
darin, den Menschen technologisch sowohl kognitiv als auch körperlich zu opti- 
mieren.”° Der technologische Posthumanismus sehe zwar ebenfalls eine Optimie- 
rung des Menschen vor, ziele jedoch auf dessen Überwindung hin zu einer „artifi- 
ziellen Superintelligenz“”° ab. 

Diese Vision der Entwicklung von Künstlicher Intelligenz findet nicht nur in 
McEwans Roman statt, auch mehrere Science-Fiction Filme und Romane spielen mit 
der Erzählung, die meistens mit dem Ende der Menschheit verknüpft sind oder 
dieses thematisieren.”’ Loh beschreibt dabei ein liberales, westliches, heterosexu- 
elles und männliches Handlungssubjekt der Strömungen.” Die Problematik dieses 
Subjektes wird durch die Ziele der Strömungen deutlich: Sowohl der technologische 
Posthumanismus als auch der Transhumanismus beabsichtigen die Optimierung 
des Menschen. Dient dabei ein solches eindimensionales Handlungssubjekt als 
Ausgangspunkt der Überlegungen, müssen in den körperlichen und kognitiven 
Optimierungsvorstellungen mit sexistischen, rassistischen und ableistischen Aus- 
schlüssen gerechnet werden. Wenn also der Mensch weitergedacht wird, jedoch z. B. 
ein heterosexueller, weißer Mann implizit als „Ideal-Mensch“ gilt, werden andere 
Subjekte (u. a. Frauen, Schwarze, Menschen mit Behinderungen) und deren Le- 
bensrealitäten (und ggf. auch abweichende Wertvorstellungen) nicht weitergedacht 
und in kognitiven und körperlichen „Optimierungen“ nicht beachtet. Weitergehend 
wird in der genannten Passage in McEwans Roman eine Zukunftsvision gezeichnet, 
in der alle Menschen miteinander und mit „den Maschinen‘? verbunden sind. Eine 
Art Verbindung aller Gedanken, aller Innenwelten, wird vorhergesagt. Subjektivität, 
Subjekte und Individualität gehören damit der Vergangenheit an. Dabei wird sich 
auf eine Körper-Geist-Dichotomie bezogen, wobei nur letzteres thematisiert wird. 
Was passiert mit den (unterschiedlichen) Körpern? Wie verändern sich dadurch 
Hierarchien und Ausschlüsse der unterschiedlichen Köper? 

Wie im letzten Abschnitt unseres Beitrags gezeigt, wird in der technologisch- 
posthumanistischen Vision Adams eine Gegenüberstellung von Subjektivität (der 
Roman, der nur noch historisch existiert; alle Menschen haben sich zu einem Be- 


24 Vgl. Janina Loh, Trans- und Posthumanismus zur Einführung, Hamburg 2018. 

25 Vgl. Ebd., 32. 

26 Ebd., 92. 

27 Vgl. Asimov Isaacs, I, Robot, 1950; Raymond Kurzweil, The Singularity Is Near. When Humans 
Transcend Biology New York 2005 und Wachowskis Film The Matrix, 1999. 

28 Vgl. Loh 2018, 140. 
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wusstsein verbunden) und Objektivitat (die rein objektive Form der Literatur, der 
Haiku, existiert nach wie vor) gezeichnet. Diese Dichotomie wird in zeitgenössi- 
schen technikphilosophischen Diskursen oder auch in der Theologie”? kritisiert. 

So argumentiert Donna Haraway in ihrer Theorie des situierten Wissens, dass 
Subjektivitat und Objektivitat in untrennbarer Weise miteinander verbunden sind. 
Das, was als objektiv angesehen werde, sei immer durch den Standpunkt und den 
Erfahrungen eines Subjekts gepragt. Haraway betont weitergehend, dass Wissen in 
konstitutiver Beziehung zu historischen Gesellschaftsformen, Technologien der 
Wissensgenerierung und sprachlichen Mustern steht.** Mit anderen Worten, Ob- 
jektivität ist immer situativ und kontingent, da sie von den Perspektiven und In- 
teraktionen der Subjekte abhängt, die sie konstruieren. Haraway lehnt damit die 
Annahme ab, dass es ein universelles und neutrales Wissen gibt, stattdessen exis- 
tieren verschiedene partiale Formen von Wissen. Das situierte Wissen sieht Sub- 
jekte untrennbar mit ihrer Umgebung verbunden und verkörpert. 

Haraways Konzept beruht auf einem postmodernen Wissensverständnis, das 
die Macht von Epistemen betont, die Geschlechter- und ethnische Kategorisierun- 
gen vornehmen. Es fordert die Anerkennung verschiedener Wissensformen und 
betont, dass jegliches Wissen von Macht- und Kulturrelationen geprägt ist. Das si- 
tuierte Wissen löst den Dualismus von forschendem Subjekt und beforschtem Ob- 
jekt auf und erkennt den Forschungsgegenstand als aktiven Akteur an. In Über- 
einstimmung mit diesem postmodernen Wissensverständnis und Haraways 
Argumentation vertreten auch wir die Ansicht, dass ohne Subjektivität keine Ob- 
jektivität existieren kann. Dies bedeutet, dass die vermeintliche Objektivität eines 
literarischen Haikus letztlich von den subjektiven Entscheidungen des Schreiben- 
den geformt wird, sei es in der Wortwahl oder in der Betonung bestimmter Ele- 
mente. Ebenso ist Kreativität untrennbar mit Subjektivität verbunden, da sie aus 
individuellen Gedanken, Gefühlen und Erfahrungen hervorgeht. Hier können KI- 
gestützte Textgeneratoren als gutes Beispiel dienen: Trotz des Anscheins von Ob- 
jektivität sind diese KlI-generierten Texte letztendlich menschlichen Ursprungs. 
Dieser Ursprung erstreckt sich nicht nur auf die Trainingsdaten, auf denen diese KI- 
Systeme basieren, sondern zieht sich auch durch den gesamten Trainingsprozess, in 
dem Menschen involviert sind. 

Es ist wichtig zu betonen, dass oft unterbezahlte Arbeitskräfte aus dem Glo- 
balen Süden eine zentrale Rolle bei der Feinabstimmung der Wahrscheinlich- 
keitsberechnungen dieser KI-Systeme spielen. Die Subjektivität und menschliche 


30 Vgl. Armin Grunwald, Wer bist du, Mensch? Transformationen menschlicher Selbstverständnisse 
im wissenschaftlich-technischen Fortschritt, Freiburg 2021. 

31 Vgl. Donna Haraway, „Situated knowledges: The science question in feminism and the privilege 
of partial perspective“, Feminist studies, Bd. 14(3), 1988, 575-599. 
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Arbeit bleiben jedoch häufig für die Endnutzer:innen unsichtbar, und der 
menschliche Akteur verschwindet, selbst wenn das Endprodukt von dieser 
menschlichen Beteiligung abhängt. Diese neokolonialistischen Strukturen der 
Ausbeutung stehen in engem Zusammenhang mit der Verschleierung menschlicher 
Arbeitskraft im Zeitgeist der Automatisierung. Dieser Zusammenhang wird an- 
schaulich im Beispiel des „Mechanical Turk“ des 18. Jahrhunderts von Wolfgang von 
Kempelen bis hin zu Amazons Marktplatz für kurzzeitige, billige Arbeit, dem 
„Mechanical Turk“ (MTurk). Von Kempelens Erfindung stellt einen vermeintlich 
automatisierten Schach-Roboter mit arabischer Verkleidung dar, während tat- 
sächlich ein menschlicher Spieler im Inneren des Geräts saß und spielte. Amazon 
vermarktet seine Plattform „MTurk“ als fortschrittliche KI und verschleiert die 
unterbezahlte Arbeit sogenannter Klick-Arbeitskräfte, die jedoch entscheidend für 
den Erfolg ihrer Plattform ist.*” 


5 Zusammenfassung und Ausblick 


In diesem Beitrag haben wir die Frage nach der Kreativität Künstlicher Intelligenz 
aus theologischer, literaturwissenschaftlicher und technikphilosophischer Per- 
spektive betrachtet. 

Wir haben argumentiert, dass Romane eine geeignete Plattform bieten, um 
geistige Freiräume zu eröffnen und explorative Szenarien zu entwickeln, die Ge- 
dankenexperimente und Abwägungen bezüglich einer potenziellen KI-Kreativität 
ermöglichen. Untermauert wurde dies zunächst durch historisch-theologische Re- 
flexionen über die Entstehung des europäischen Romans, im Zusammenhang mit 
aufklärerischen Idealen und dem Erleben von Kontingenz. Die Entstehung des eu- 
ropäischen Romans symbolisierte den Übergang von einer Weltanschauung der 
Vorherbestimmung zur Betonung individueller Erfahrungen und der Bewältigung 
von Kontingenz. Dieser Übergang hin zu mehr Freiheit des Denkens wurde durch 
Romane maßgeblich unterstützt, da sie die Erforschung neuer Ideen und Ent- 
wicklungen zuließen. Anschließend haben wir das Potenzial einer kreativen KI 
anhand von McEwans Roman Maschinen wie ich erörtert. Dieses Werk veran- 
schaulichte, wie unterschiedliche Formen von Kreativität einer KI innerhalb der 
Fiktion konstruiert werden können. 


32 Vgl. Mary Gray/Siddarth Suri, Ghost Work. How to stop Silicon Valley from Building a New Global 
Underclass, Boston/New York 2019; Rafael Grohmann/Willian Fernandes Araújo, „Beyond Mecha- 
nical Turk: The Work of Brazilians on Global AI Platforms‘, in AJ for Everyone? Critical Perspectives, 
hg. von Pieter Verdegem, London 2021, 247-266. 
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Die im Roman aufgeworfenen Konzepte dieser „Künstlichen Kreativität“ ha- 
ben wir abschließend im Kontext technikphilosophischer Diskurse eingeordnet und 
diskutiert. Hierbei wurde der technologische Posthumanismus beleuchtet und 
darauf hingewiesen, dass diese Strömung mit bestimmten Vorstellungen von Op- 
timierungen und damit einhergehenden Exklusionen einhergeht. Unsere Untersu- 
chung mündete in eine Betrachtung des situierten Wissens von Haraway und der 
Bedeutung von Subjektivität in der Konstruktion von Objektivität. Wir haben ge- 
zeigt, dass selbst vermeintlich objektive Literaturformen wie Haikus von subjekti- 
ven Entscheidungen beeinflusst werden. Jenseits des Romans möchten wir zudem 
auf oft in Debatten um autonome/künstliche/automatisierte Kreativität ignorierte, 
unterbezahlte Arbeit von Menschen aus dem Globen Süden hinweisen, die eine 
tragende Rolle für den Erfolg vieler KI-Systeme spielt. 


33 Elliot Paul/Dustin Stokes, „Creativity“, The Stanford Encyclopedia of Philosophy, 2023, in [https:// 
plato.stanford.edu/entries/creativity] (Zugriff: 03.10.2023). 


Alisa Geiß 
Aus Text wird Bild 


Diskurse der Illustration zu Bildgeneratoren und Prompts 


Abstract: Over the last two years, the third wave of artificial intelligence (AI) has 
emerged powerful tools for both artistic expression and scientific research. In de- 
sign, image generators display an equivalent disruption to text generators, while the 
medium of text creates the new scope of writing prompts. This contribution dis- 
cusses the ambivalences between text and image generators via two main theses: 
first about the potential of prompting and generated images as a medium of dis- 
course; second, it examines the reasoning behind their tendency to be mystified. 
Prompts can be automated through text generators and used to generate images on 
a wider scale, making it a praxis in which precise wording becomes crucial for 
generating anything. Generated images practice a form of mimesis. With Generative 
Adversial Networks (GANs) producing non-referential images, the discourse of il- 
lustration is concerning the obsolescence of authorship. Al is observed to manifest a 
dual character, serving as both tool and author, even though AI does not own the 
classification of a person and is not an author in legal terms. The utilization of text 
and image generators is intertwined with a mythicized notion due to their non- 
verifiable mode of operation. The myth of Alis a product of its indeterminacy. 


In der Geschichte der Technik ist die Beziehung zwischen Mensch und Maschine 
von einer Vorstellung geprägt: Maschinen über die menschliche Sprache bedienen 
zu können. Von den Anfängen der Chatbots wie Joseph Weizenbaums ELIZA’ über 
Cleverbot bis hin zu KI-Textgeneratoren wie ChatGPT ist dieses Konzept längst 
Realität. Durch eine Textebene können Aufgaben nicht nur mühelos kommuniziert 
werden, sondern ebenso wird durch Text in seiner Funktion als In- und Output eine 
Anwendung des Textgenerators als Metainstanz ermöglicht. Eine Entwicklung, die 
an die Turing-Maschine erinnert, welche die Theorie des Programmes auf seine 
multiple Anwendbarkeit erweiterte. 

Betrachtet man die frühen Ansätze der künstlichen Intelligenz als interdiszi- 
plinäre Vision, wollte sie das überwinden, was C.P. Snow 1959 provokant als „Zwei 


1 Vgl. Joseph Weizenbaum, Die Macht der Computer und die Ohnmacht der Vernunft, Berlin 1978, 
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Kulturen“-Phänomen beschrieb:? Eine Trennung der wissenschaftlichen Diszipli- 
nen in Geistes- und Naturwissenschaften. KI verbinde technische und humane 
Arbeitsweisen - ein Narrativ, welches bereits vor 70 Jahren unter der Kybernetik 
existierte.* Ist mit der dritten Welle künstlicher Intelligenz von einer Disruption in 
beiden Arbeitswelten zu sprechen, so trägt ein schneller Wandel die Konsequenz 
einer Mythenbildung. Unklar ist der Umgang mit KI-Generatoren, unklar der ge- 
sellschaftliche Konsens zu Restriktionen. Versuche, über die KI-Lernprozesse auf- 
zuklären, scheitern dabei an zwei Faktoren, an der privatisierten Software im Zuge 
von marktführenden Unternehmen sowie an einer unmöglichen Nachvollziehbar- 
keit der Algorithmen. Ein ganzheitliches Verständnis bleibt unerreichbar, wenn 
kein Einblick in die Funktionsweisen möglich ist. Das Arbeiten mit KI grenzt somit 
an eine immanente Unbegreiflichkeit. 

Die Anwendung von Prompts, einer textlichen Aufgabenstellung für die KI, 
beschränkt sich dabei nicht nur auf die Textproduktion. Im Bereich der Illustration 
bringen Bildgeneratoren wie Midjourney oder StableDiffusion eine ebenbürtige 
Disruption. Textgeneratoren können hier für eine automatisierte Produktion von 
Prompts eingesetzt werden. Die Kl-unterstützte Produktion von Bildern über 
Prompts sowie deren mögliche Kommerzialisierung werfen eine Reihe von Fragen 
auf. Wie verändert der Einsatz von KI die Bildrezeption? Besitzen Text- und Bild- 
generatoren eine Autorenfunktion? Können Prompts als Schreibpraxis betrachtet 
werden? 

Bereits diese wenigen Leitfragen verdeutlichen, dass Text und Bild im Kontext 
von Kl erneut betrachtet werden müssen. Dafür ist es hilfreich, ein Verständnis der 
Funktionsweisen von Bildgeneratoren zu besitzen. Ziel dieses Beitrages ist es, die 
Ambivalenzen zwischen Text- und Bildgeneratoren über zwei Hauptthesen zu er- 
läutern, zunächst über das Potential von generierten Bildern als Diskursmedium, 
dann über ihren immanenten Mythos. 


3 Vgl. C.P. Snow, The Two Cultures, Cambridge 2001 [1959]. 

4 Exemplarisch zu nennen sind hier Norbert Wiener, Cybernetics or Control and Communication of 
the Animal and the Machine, Cambridge 1961, 133-155; Karl Steinbuch, Automat und Mensch. Ky- 
bernetische Tatsachen und Hypothesen, Berlin/Heidelberg 1965 oder Georg Klaus, „Kybernetik - eine 
neue Universalwissenschaft der Gesellschaft?“, in Zur Kritik der bürgerlichen Ideologie, hg. von 
Manfred Buhr, Berlin 1973. 
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1 Grundlagen eines Generative Adversarial 
Networks (GANs) 


Das Erkennen und Klassifizieren von Zusammenhängen ist ein wesentlicher Be- 
standteil des Lernens. KI, die mit einer Texteingabe Bilder produziert, ist auf ein 
multimediales Identifizieren von Signifikat und Signifikant trainiert. Das Stan- 
dardmodell eines Bildgenerators basiert auf einem Generative Adversial Network 
(GAN), welches eine spezielle Methodik zur Klassifizierung anwendet. KI beschreibt 
hier das Trainieren eines künstlichen neuronalen Netzes auf das Lösen komplexer 
Aufgaben. 

Neuronale Netze funktionieren als Informationsträger, die den gewünschten 
Input verarbeiten. Ein Neuron ist mit Neuronen aus einer anderen Ebene ver- 
bunden. In einem Perzeptron, einem vereinfachten neuronalen Netz, gibt es drei 
Ebenen: Die Input-, Hidden- und Output-Ebene.° Jede Ebene von Neuronen besitzt 
eine unterschiedliche Aufgabe. 


Abbildung 1: Visualisierung eines Perzeptrons 
mit Input-, Hidden- und Output-Ebene (v..n.r.). 


Die Input-Ebene empfängt Informationen in einem beliebigen Dateiformat. Die 
Hidden-Ebene ist für die Formatierung und Verarbeitung der Information verant- 
wortlich und bildet den Großteil des Netzes. Die Output-Ebene gibt die finalen 
Werte der Hidden-Ebene aus. Mehrere Ebenen von gleichtätigen Neuronen bilden 
ein Layer. 

Am Beispiel eines Kükens soll ein Netzwerk dieses auf einem beliebigen Bild 
erkennen. Wie gelingt das? Bei der Eingabe eines Bildes muss der Input-Layer das 
Bild erst dekodieren, um dessen Inhalt zu erfassen. Jedes Neuron übersetzt einen 
Pixel in einen numerischen Wert und sendet diesen Wert an den Hidden-Layer. Dort 


5 Vgl. Günther Daniel Rey/Karl F. Wender Neuronale Netze. Eine Einführung in die Grundlagen, 
Anwendungen und Datenauswertung, Bern 2011, 13-14. 
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findet das Generieren von Zusammenhängen statt: Die Werte der Pixel werden so 
gewichtet, dass sie ein Muster bei gleichen Objekten aufzeigen. Befinden sich 
Bildelemente wie Schnabel, Augen, Körper oder Farbe des Kükens immer wieder im 
gleichen Verhältnis zueinander, werden sie höher gewichtet.° Sind Bildelemente für 
die Identifikation irrelevant, wie Hintergründe oder andere Objekte, werden sie 
weniger gewichtet. Je stärker ein Netz gewichtet ist, desto präziser kann es seine 
Aufgabe ausführen. 


Abbildung 2: Alles Küken? 


Da ein Netzwerk nicht von Anfang an weiß, was ein Küken ist, benötigt es eine 
große Menge an bereits sortierten Bildern, die Küken enthalten. Während der 
Trainingsphase gewichtet sich das Netzwerk nach den vorgegebenen Bildern. Wenn 
dem Netzwerk tausend Bilder eines Autos als Küken beigebracht werden, wird es 
ein Auto als „Küken“ assoziieren. Dieser Lernprozess kann bei Identifizierungen zu 
automatisierten Vorurteilen führen — wenn das Netzwerk ausschließlich Bilder von 
Frauen in Kleidern und langen Haaren vorfindet, wird es zunächst nur diese At- 
tribute mit dem Begriff „Frau“ identifizieren. Ein gut trainiertes Netzwerk bedarf 
eines diversen Trainingssatzes. 

Der Output-Layer interpretiert die Werte zu einer Wahrscheinlichkeit, dass das 
Bild ein Küken beinhaltet. Das Ergebnis wird nun vom Anwender bewertet: Ist es 
nicht akkurat, werden die Werte erneut gewichtet, bis ein besseres Ergebnis vor- 
liegt. In der Testphase muss das Netzwerk beliebige Bilder als Küken oder kein 
Küken klassifizieren können. 

Für Netzwerke, die Bildinhalte identifizieren sollen, reicht ein betreutes Lernen 
aus — EntwicklerInnen können die Ergebnisse des Netzwerkes kontrollieren. Wie 
können nun Bildinhalte generiert werden? Wörtliche Beschreibungen besitzen 
zunächst eine breite Interpretationsfläche, was ihre visuelle Auslegung betrifft. 
Wenn ich ein Bild von einer Tasse Kaffee sehen will, ist damit nichts über den 


6 Kompressionsverfahren wie JPEG funktionieren auf ähnliche Weise, indem sie aneinander- 
grenzende ähnliche Farbtöne erkennen und zu einem Farbton zusammenführen. 
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Bildstil, die Perspektive oder Art der Tasse gesagt. Allerdings besitze ich gegenüber 
einem untrainierten Netzwerk eine bildliche Vorstellung, wie das Beschriebene 
aussehen könnte. Nach diesem Prinzip funktioniert das unbetreute Lernen. 

Für das unbetreute Lernen werden zwei Netzwerke benötigt, die in einem GAN 
zusammenarbeiten.’ Das Erste Netzwerk spielt die Rolle des Identifizierenden: Es 
lernt alle Gegenstände und Zusammenhänge, die für das Generieren benötigt 
werden. Die Trainingsphase eines GANs bedarf bis zu Millionen vorsortierter Bilder. 
Das Trainieren wird dadurch nicht nur zeitintensiv, sondern verbraucht eine Menge 
Rechenkapazität, was die Entwicklung eines GANs zu einem kostenintensiven 
Prozess macht.® 

Das zweite Netzwerk funktioniert als Gegenspieler des lernenden Netzwerkes. 
Seine Aufgabe ist es ebenfalls, Bilder zu erstellen, die der Beschreibung entsprechen 
- nur ohne den Input vorsortierter Bilder. Es startet mit unsortierten Pixeln, die es 
in eine sinnvolle Ausgabe umwandeln muss. Für den Anfang bekommt das zweite 
Netzwerk unsortierte Bilder geliefert, die es nachmodelliert. 


Abbildung 3: Schritte eines GANs während dem Generieren einer Kaffeetasse. 


Die Ergebnisse der zwei Netzwerke werden anonym an einen Diskriminator ge- 
sendet. Der Diskriminator muss nun beurteilen, welches Bild von dem vortrai- 
nierten Netzwerk stammt. Durch das Feedback des Diskriminators nähert sich das 
zweite Netzwerk den Ergebnissen des ersten an, optimal so weit, dass der Diskri- 
minator nicht mehr zwischen Original und Fälschung unterscheiden kann. Mit 
dieser Prüfmethode wird die Qualität der generierten Bilder enorm gesteigert. Das 
unbetreute Lernen kann so ein Netzwerk trainieren, welches eine Vielfalt von 


7 Vgl. Antonia Creswell et al., „Generative Adversarial Networks: An Overview“, IEEE signal pro- 
cessing magazine, 2018. 

8 Das Trainieren eines Nvidia StyleGANs für eine Bildfläche von 1024x1024 Pixeln benötigt eine 
Lernzeit von mehr als 41 Tagen, vgl. NVLabs, „StyleGAN - Official TensorFlow Implementation: An 
Overview“, in [github.com/NVlabs/stylegan] (Zugriff: 28.07.2023). 
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Bildern kombinieren kann, ohne auf vorgegebene Assoziationen angewiesen zu 
sein.” 

Die zunehmende Qualität von GANs führen zu einem Diskurs über den Umgang 
mit generierter Kunst, Fotos oder Illustrationen. Ende 2022 etablierte sich auf di- 
gitalen Plattformen eine „Say no to AI art“ — Bewegung, die die Produktion von 
generierten Bildern über eine Protestform ablehnt.” Neben dem Umgang mit der 
disruptiven Technologie stellt sich die Frage, wie generierte Bilder in einem visu- 
ellen Diskurs funktionieren. 


2 Bilder als Diskursmedium 


Bilder agieren seit Urzeiten als symbolisches Medium von Kulturen. Ein Abbild steht 
in der Vermittlung des Gezeigten und des Begriffs. Dabei unterliegt es keiner in- 
härenten Bedeutung. Eine Bildsemiotik wird durch ständig wandelnde Konventio- 
nen, Kontexten und Interpretationspraktiken konstruiert. 

Im digitalen Diskurs praktizieren generierte Bilder eine Form des Mimetischen. 
Mimesis, die „frühe Einheit von [...] physignomischer Darstellung und technogno- 
mischer Verfügung“'', versteht das Erkennen von Sachverhalten als Dialektik des 
geistig Erfahrbaren und des materiellen Auslösers. Die Intention des Anwendenden 
kann durch GANs zu einer visuellen Erfahrung generiert werden. Das Kriterium der 
Repräsentation wird nur nachgeahmt. Generierte Bilder stehen nicht in der vollen 
Autorschaft des Anwendenden und sind auch kein Abbild der Realität. Allerdings 
führen sie in ihrer Symbolik eine bewusste Konfrontation sowohl gegen die Au- 
torschaft als auch gegen den Anspruch auf einen Wahrheitsgehalt. 

Ein Beispiel dafür ist das generierte Bild von Papst Franziskus in einer modi- 
schen Daunenjacke, das Anfang 2023 einen Punkt in der Debatte markierte.'” Der 
Anwender Pablo Xavier, ein Bauarbeiter aus Chicago, veröffentlichte das Bild zu- 
nächst als Meme im Internet. Die Wirkung des Komischen führte mit seiner her- 
ausragenden Qualität jedoch zu Desinformationen über den Papst, Kritik an der 


9 Vgl. Scott Reed et al., „Generative Adversarial Text to Image Synthesis“, PLMR, Bd. 48, 2016, 1060- 
1069. 

10 Vgl. Oliver Bünte, „Artstation: Künstler protestieren gegen KI-Kunstwerke und KI-Trainings“, 
heise, 2022, in [heise.de/news/Artstation-Kuenstler-protestieren-gegen-KI-Kunstwerke-7397005.html] 
(Zugriff: 28.07.2023). 

11 Jürgen Habermas, „Anthropologie“, in Das Fischer Lexikon Philosophie, hg. von Alwin Diemer/Ivo 
Frenzel, Frankfurt a.M. 1958, 18-35, 28. 

12 Vgl. Christian Schicha, „KI-generierte Deep Fakes. Wie gehen wir mit einem Papst im Daunen- 
mantel um?“, deutschlandfunk, 2023, in [https://tip.de/e0jh4] (Zugriff: 28.07.2023). 
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katholischen Kirche und vermehrter Unsicherheit tiber die Bebilderung von Be- 
richten. 


Abbildung 4: Ceci n’est pas un pape. 


Der Fall Xaviers veranschaulicht, wie ein generiertes Bild zwar kein direktes Abbild 
darstellt, es aber imitiert und als solches eingesetzt werden kann. Im Gegensatz zur 
Falschung reprasentiert das generierte Bild keine Referenz. Es wird zum eigen- 
standigen Zeichen, dessen Bedeutung und Interpretation nicht eindeutig sind. 

Der Kontrast zwischen dem generierten Bild als nicht-referentielles Abbild und 
der Verwendung von GANs zur Stilreproduktion verdeutlicht die zunehmende 
Komplexität in der Beziehung zwischen visueller Repräsentation und künstleri- 
scher Intention. Während das generierte Bild in seiner Semantik variabel ist, wird 
seine Stilistik durch GANs wie Midjourney in einem strukturierten, reproduzier- 
baren Rahmen dargestellt. Mit trainierten GANs können dabei nur Stile reprodu- 
ziert werden, die in großen Datensätzen prominent sind. Stile, von denen es wenige 
Exemplare gibt, sind auch schwieriger zu trainieren. Große GANs sind also keine 
Universalmaschinen, die alles reproduzieren können. Einerseits ermöglicht die 
Technologie neue Formen der künstlerischen Äußerung durch das Prompten von 
vorher unzugänglichen Stilen, andererseits entstehen durch die Automatisierung 
des Stils neue Begrenzungen für die bildliche Darstellung. Was bedeutet das für die 
Illustration? 


2.1 Illustration im Paradigmenwechsel 


Der Begriff der Illustration steht in einem Spannungsfeld zwischen den Disziplinen 
der Kunst und des Designs. Illustration besitzt das Ziel einer Inhaltsvermittlung und 
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agiert zugleich im Stil einer Autorschaft. Was wird dargestellt - und wie? Durch ihre 
visuelle Kommunikation entsteht eine Wissenstransformation. Der zu vermittelnde 
Inhalt wird mithilfe einer semiotischen Logik zugänglicher. Gedankengänge können 
durch eine Ausführung illustriert oder Illustration als die Bebilderung eines Textes 
verstanden werden. Grundlegend beschreibt Illustration die Darstellung einer in- 
tentionalen Idee, traditionell mit zeichnerischen Mitteln. 

In einer zunehmend bebilderten Welt befindet sich die Illustration in einer 
ubiquitären Position. Otto Neurath beschrieb Anfang des 20. Jahrhunderts die ge- 
sellschaftliche Entwicklung, von Bildern zu lernen und durch sie zu kommunizie- 
ren, als „großen Teil ihres Wissens und ihrer allgemeinen Bildung durch bildhafte 
Eindrücke“.'? Die Transformation zu einem „visuellen Zeitalter“'* bedeutet für die 
Illustration eine erweiterte Anwendungsfläche sowie eine Verantwortung gegen- 
über ihrer Semiotik. 

Wo eine Illustration eingesetzt wird, ist von ihrem Anwendungsfeld abhängig. 
Kein Beispiel lässt sich auf eine feststehende Anwendung reduzieren. Allerdings 
existiert für IllustratorInnen vorher ein Konsens, wie etwas dargestellt wird. 

Die formelle Illustration versucht, das Abzubildende zu erklären. Für eine 
neutrale Darstellung orientiert sie sich an Gestaltungsregeln, die zu einer größt- 
möglichen Lesbarkeit beitragen. Baupläne, die biologische Illustration einer Katze 
oder das Schriftsystem „Isotype“ vermitteln einen Lerngehalt, der durch eine 
möglichst lesbare Stilistik zugänglich wird. 

Werbende Illustrationen passen ihre Bildsprache an eine Zielgruppe an. Sie 
versuchen, ihr Publikum von einer dargestellten Idee zu überzeugen. Der Autor 
passt sich an das Idealbild des Auftraggebers an, während die Stilistik des Autors 
zur dessen visuelle Identität übernimmt. Gleichzeitig wirkt die Illustration als Äs- 
thetisierung des Dargestellten, die eine repräsentative Werbefigur bildet. Der US- 
amerikanische Illustrator Gil Elvgren verwendete für Coca-Cola Szenarien eines 
Pin-Up-Girls. Es entsteht eine Symbolik, die das Sehen der Dame mit dem Produkt 
assoziiert. Die werbende Illustration funktioniert so als ästhetische Manipulation. 

Subjektive Illustrationen kommunizieren aus der Perspektive der eigenen Au- 
torschaft. Sie vermittelt einen phänomenologischen Bildgehalt: Wie nehme ich et- 
was wahr? Die Illustration eines Teddybärs in Pastellfarben und rundem Strich 
wirkt anders als ein kubistischer Stil in Grautönen. Für welche Stilistik sich ent- 
schieden wird, liegt an den ästhetischen Vorhaben des Autors, die sowohl indivi- 
duell als auch kulturell bedingt sind. 


13 Otto Neurath, „Statistische Hieroglyphen, in Diagrammatik-Reader: Grundlegende Texte aus 
Theorie und Geschichte, hg. von Birgit Schneider/Christoph Ernst/Jan Wöpking, Berlin/Boston 2016 
[1927], 213-218, 213. 

14 Vgl. Gerhard Paul, Das visuelle Zeitalter. Punkt und Pixel, Göttingen 2016, 712. 
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Die untenstehende Illustration ist die klassische Bebilderung einer Idee. Sie 
hilft, das Beschriebene besser zu verstehen. Illustratoren als „Maler des modernen 
Lebens“, wie sie Charles Baudelaire beschrieb, äußern über den Stil ihre Wahr- 
nehmung, während sie gleichzeitig über das Abgebildete informieren.*® 


Abbildung 5: Die Comicfigur „Härbärt“®, links im 
Original, rechts eine generierte Illustration im 
verwandten Stil, erzeugt mit Midjourneys Niji 
5.0.Vgl. Alisa Geiß, „HÄRBÄRT“, Webcomic, 2022, 
in [alisageiss.com/haerbaert-comic] (Zugriff: 
28.07.2023). 


Das zentrale Paradigma der Illustration ist das Skizzieren. Im Gegensatz zum 
Prompting erfolgt das Skizzieren einer Idee nicht über eine detaillierte Beschrei- 
bung, sondern über das Zusammenspiel der bildlichen Vorstellung und der Beur- 
teilung ihres Abbilds, der Skizze. Skizzieren ist ein explorativer Prozess, in dem der 
Freiraum, mit Form und Darstellung zu experimentieren, einen Lerngehalt über die 
eigene Wahrnehmung beinhaltet. 

Prompting unterscheidet sich fundamental von diesem Ansatz. Über Prompts, 
detaillierte Beschreibungen des gewünschten Bildes, können die trainierten Stile 
eines GANs dem beschriebenen Bild zugeordnet werden. Während das Skizzieren 
einen unfertigen Prozess darstellt, kombiniert das Prompting die Vorstellung mit 
einem ausgearbeiteten Ergebnis. Hierbei nimmt die Ebene des Textes eine ähnliche 
Rolle des Skizzierens ein. 


15 Vgl. Charles Baudelaire, zitiert nach Andreas Rauth, „Unverwechselbar. Über Stil und Authen- 
tizität in der Illustration“, in superILLU. Zu einer Theorie der Illustration, hg. von Juliane Wenzl et al., 
2022, 197-205, 197. 
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2.2 Das Verhaltnis von Text und Bild zu Prompts 


Beim Verfassen von Prompts ist eine prazise Beschreibung entscheidend. Was nicht 
beschrieben wird, kann auch nicht generiert werden — der Prompt einer „Ente“ 
spezifiziert nicht, ob damit die Tierart oder das Automodell gemeint ist. Ein bild- 
liches Denken hilft auch beim Prompten. Die spezifischen Bedingungen der jewei- 
ligen Bildelemente müssen erkannt und beschrieben werden. Die Wortwahl des 
Prompts beeinflusst ebenfalls das Ergebnis. Ein Prompt, der auf ein konzeptionelle 
Darstellung abzielt, benötigt eine andere Formulierung als ein Prompt, der ein Bild 
exakt reproduzieren will. 


Abbildung 6: Prompt: „a chunky round white 
dove wearing a tiny small black hat, carrying a 
black briefcase, not colored, just outlines“, 
erzeugt mit Midjourneys Niji 5.0. 


Das Erstellen von Prompts über einen Textgenerator ermöglicht eine automatisierte 
Herstellung von Prompts. Dies bewirkt einen verbesserten Output innerhalb GANs, 
da das Anpassen eines Prompts ein zeitintensiver Prozess sein kann und nach ei- 
nem Trial-and-Error-Prinzip funktioniert. Durch eine Automatisierung kann die 
Reichweite an möglichen Formulierungen erhöht werden, womit die Grenzen eines 
GANs ausgetestet werden können. 

Ist das „Prompten“ also als Fähigkeit wahrzunehmen? Mit einem Rückblick auf 
die Erfindung der Fotografie wurde diese von Baudelaire stark kritisiert. Fotogra- 
fierende seien „gescheiterte Maler mit zu wenig Talent“'°. Baudelaire argumen- 
tierte, dass Fotografie lediglich eine Entwertung der menschlichen Vorstellungs- 
kraft darstelle. Seine überholte Position erinnert an das Argument, generative KI sei 
für das kreative Schaffen kontraproduktiv. 


16 Vgl. Charles Baudelaire, zitiert nach James Rubin, Impressionism and the Modern Landscape, 
Berkeley 2008, 43-45. 
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Im Kontrast zur Fotografie besitzen GANs kein klares Verhältnis zwischen 
Werk und Schöpfenden. Ein Gedankenexperiment:'” Eine Kunstsammlerin gibt 
einem menschlichen Künstler, den sie nicht kennt, einen Zettel mit ihrer Idee für 
ein Kunstwerk. Der Künstler setzt diese Idee um und übergibt ihr das fertige Werk. 
Die Kunstsammlerin ist trotz ihrer originellen Idee für das Werk nicht die Schöp- 
ferin, sondern der Künstler. Bei KI verhält es sich zunächst ähnlich: Auch wenn 
jemand eine Idee als Prompt formuliert und KI ein Ergebnis produziert, hat der 
Anwendende nicht das Werk erschaffen. Da KI jedoch nicht als Person gilt, liegt die 
Erschaffung des Werks weder auf der Seite des Anwendenden noch auf der Seite 
der Algorithmen. Das Prinzip der Autorschaft scheint bei generativen Prozessen 
nicht bestimmbar zu sein.'® Damit wird ein Problem sichtbar, das Roland Barthes‘ 
literarischem „Tod des Autors“ nahekommt: Führt die Abwesenheit des Autors zu 
einer obsoleten „Entzifferung“ des Arbeitsprozesses?"? 


2.3 Autorschaft und (Bild-)Generatoren 


Der Diskurs über den Stellenwert von GANs ist jung und durch ihre wachsende 
Verfügbarkeit angetrieben. Positionen reichen von der Ablehnung von GANs und 
Klagen zum (vermeintlichen) Missbrauch des Urheberrechts”? bis zum KI-Futuris- 
mus um Raymond Kurzweil und der Marginalisierung von Kritik.” 

Die Initiative von Illustratoren, die Existenz von GANs zu ignorieren, ist eine 
Protestreaktion. Sie bietet keine nachhaltige Verteidigung des gestalterischen 
Handwerks gegenüber KI. Die eigentliche Botschaft ist die Erkenntnis, dass die ei- 
gene Arbeit entfremdet und automatisiert werden kann. Dabei ersetzt die Präsenz 
von GANs nicht die Rolle der kreativ Tätigen. Was stattfindet ist eine Neuorientie- 


17 Vgl. Chris Shehan, 31.08.2022, in [twitter.com/ChrisShehanArt/status/1564821938400264192] (Zu- 
griff: 27.08.2023). 

18 Für weiterführende Betrachtungen zur Autorschaft und Urheberrecht verweise ich auf den 
Tagungsbeitrag von Amrei Bahr. 

19 Vgl. Roland Barthes, „Der Tod des Autors“, in Das Rauschen der Sprache, Frankfurt a.M. 2006 
[1969], 57-63, 62. 

20 Vgl. Initiative Urheberrecht, „Urheber:innen und Künstlerinnen fordern Maßnahmen zum 
Schutz vor generativer KI in der Europäischen KI-Verordnung“, Stellungnahme 14.09.2023, in 
[https:/tip.de/m6nab] (Zugriff 04.10.2023) 

21 Vgl. Raymond Kurzweil, The Singularity Is Near: Why Humans Transcend Biology, New York 2005 
oder Anudeex Shetty/Nivesh Raj, „A Study on Recent Advances in Artificial Intelligence and Future 
Prospects of Attaining Superintelligence“, in Proceedings of Third International Conference on 
Communication, Computing and Electronics Systems, Bd. 844, hg. von V. Bindhu/Joäo Manuel R. S. 
Tavares/Ke-Lin Du, Singapur 2022, 879-892. 
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rung ihrer Arbeitsweise. Die Kamera hat den Maler nicht ersetzt, sondern ihn von 
seinen Portraitaufträgen befreit. Die Kontroverse liegt in den sozialwirtschaftlichen 
Faktoren, die die Arbeit von Kreativen erst ermöglicht und nun durch eine Dis- 
ruption zu verringern drohen. 

Der im Jahr 2023 begonnene und erst im Herbst beendete Writers Guild-Streik 
in Hollywood zeigt die Bereitschaft von Unternehmen, generierte Inhalte in die 
Kulturwirtschaft zu integrieren. Das dreijährige Abkommen zwischen Autoren und 
diversen Netzwerken verhandelt den Umgang mit KI zugunsten der Autoren in der 
Schreibbranche. Zunächst besteht bei der Arbeit mit KI eine Kennzeichnungs- 
pflicht.”” Dies soll vor einem Vergleich zwischen menschlichen und generierten 
Schriften schützen und die Integrität des Autors bewahren. Das Schreiben mit KI 
darf zusätzlich nicht als Arbeitsmethode vorausgesetzt werden. 

Als Kernelement ist in der Vereinbarung unter Artikel 72 B deklariert, dass KI 
keine Person darstellt und damit keinen Anspruch auf Urheberrechte besitzt oder 
in einer Form entlohnt werden muss.” Amerikanische Autoren behalten ihre Ur- 
heberstellung, wenn sie mit generierten Inhalten arbeiten. Sollte das Unternehmen 
einem Autor generiertes Material zur Verfügung stellen, wird dieses als literari- 
sches Material betrachtet und interferiert nicht mit der Autorschaft.”* Das Unter- 
nehmen darf das erstellte Material zudem nicht veröffentlichen oder nutzen, um 
diese Vereinbarung zu umgehen. 

Ein Problemfeld für Autoren bleibt das unmögliche Überprüfen der Datensätze 
von Text- und Bildgeneratoren auf potenzielle Urheberrechtsverstöße. Im deut- 
schen Raum ist die Inhaltserstellung über Data Mining seit dem 2021 erlassenen 
$ 44b Urheberrechtsgesetz (UrhG) definiert. Jedoch ist im Gegensatz zum existie- 
renden $ 60d UrhG, das sich auf Text- und Data Mining in der Wissenschaft bezieht, 
mit $ 44b die Verarbeitung von Daten auch im privaten Raum gestattet.”° Die Er- 
lassungen werden mit einer Anregung von Innovation in der Privatwirtschaft be- 
gründet. 

Obwohl die Reproduktion von urheberrechtlich geschützten Inhalten wie Co- 
micfiguren ohne die Einwilligung des Urhebers dank §§ 19a und 44 UrhG weiterhin 
geschützt ist, bleibt die Veröffentlichung des Werks die Voraussetzung für die In- 
tegration in Generatoren. Eine Grauzone bildet das Web Scraping, dem Sammeln 
von repräsentativen Daten über Suchmaschinen oder ähnliche Websites. Exem- 


22 Vgl. „Memorandum of Agreement for the 2023 WGA Theatrical and Television Basic Agreement“, 
in [wga.org/uploadedfiles/contracts/2023_mba_moa.pdf] (Zugriff: 26.09.2023), 69. 

23 Ebd., 68. 

24 Ebd., 69. 

25 Vgl. Benjamin Raue, ,,Die Freistellung von Datenanalysen durch die neuen Text und Data Mining- 
Schranken (§§ 44b, 60d UrhG)“, Zeitschrift für Urheber- und Medienrecht, Baden-Baden 2021, 793-802. 
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plarisch genügt das Abbild eines Gemäldes in einem Online-Shop, welches über eine 
Bildersuche gefunden werden kann. Darunter leiden besonders Künstler und Au- 
toren, die eine weite digitale Präsenz besitzen. Bildgeneratoren wie Midjourney 
oder StableDiffusion reproduzieren unter der Nennung bestimmter Autoren gerne 
mal ein Wasserzeichen. Ob KI-Unternehmen bei Verstößen von generiertem Output 
auch haften müssen, bleibt ungeklärt und von den Nutzungsbedingungen des An- 
bieters abhängig. So heißt es zum Beispiel bei Midjourney: 


We provide the service as is, and we make no promises or guarantees about it. [...] If You [sic] 
knowingly infringe someone else’s intellectual property, and that costs us money, we’re going to 
come find You and collect that money from You. We might also do other stuff, like try to get a 
court to make You pay our attorney’s fees. Don’t do it.”° 


Midjourney-CEO David Holz beschreibt den Bestand seines Datensatzes als „große 
Repräsentation des Internets“.”” Das Generieren eines Prompts basiert auf dem 
Erfahrungsgehalt von Millionen abrufbaren Bildern. Generative Algorithmen stüt- 
zen sich auf die „vergegenständlichte Arbeit“: eines Menschen, dessen Werke im 
Internet veröffentlicht wurden. Der Schematismus der Bilder wird über die Ma- 
schine in eine Dienstleistung integriert; ein Prozess, den Marx als „general intellect“ 
beschrieb: 

Die Entwicklung des capital fixe zeigt an, bis zu welchem Grade das allgemeine 
gesellschaftliche Wissen, knowledge, zur unmittelbaren Produktivkraft geworden ist 
und daher die Bedingungen des gesellschaftlichen Lebensprozesses selbst unter die 
Kontrolle des general intellect gekommen und ihm gemäß umgeschaffen sind.” 
Bei Marx wird unter dem allgemein zugänglichen Wissen das verstanden, was eine 
vorangegangene Generation der Jetzigen zur Verfügung stellt.” Niemand muss den 
Computer neu erfinden, um auf sein Konzept zugreifen zu können. Genauso sind 
Handwerke, physikalische Gesetze oder Weltkarten Produkte von vergesellschaf- 
tetem Wissen, welches“ nicht neu erarbeitet werden muss. 


26 Midjourney, „Terms of Service“, Abs. 10 „Limitation of Liability and Indemnity“, in [docs.mid- 
journey.com/docs/terms-ofservice] (Zugriff: 25.09.2023). 

27 Vgl. David Holz, „Midjourney Founder David Holz On The Impact Of AI On Art, Imagination And 
The Creative Economy“, Forbes, in [forbes.com/sites/robsalkowitz/2022/09/16/midjourney-founder- 
david-holz-on-the-impact-of-ai-on-art-imagination-and-the-creative-economy] (Zugriff: 28.07.2023). 
28 Karl Marx, „Der relative Mehrwert“, in MEW, Bd. 43, Berlin 1983 [1858], 321. 

29 Karl Marx, „Grundrisse der Kritik der Politischen Ökonomie“, in MEW, Bd. 42, Berlin 1983 [1858], 
602, Hervorh. im Original. 

30 Vgl. Wolfgang Fritz Haug, „General intellect“, in Historisch-kritisches Wörterbuch des Marxismus 
(HKWM), Bd. 5, hg. von Institut für Kritische Theorie (INKRIT), Hamburg 2001, 230-242. 
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Mit der Automatisierung des Arbeitsprozesses wird die Expertise akkumuliert. 
Die Maschine löst als effizientere Produktivkraft den Arbeiter ab, dieser tritt „neben 
den Produktionsprozess, statt sein Hauptagent zu sein.“' Die Verbreitung und 
Nutzung des öffentlichen Wissens stehen dabei in Konkurrenz mit der Arbeitszeit. 
Ein Grund für Unternehmen, ihre auf Open-Source gebaute Software zu privati- 
sieren. 

Das Silicon Valley, darunter OpenAl als aktueller Hauptakteur der KI-Ent- 
wicklung, schildert die Akkumulation von Expertise mit einem dualistischen Nar- 
rativ.” Einerseits schaffe der technologische Fortschritt Innovationen, die in allen 
Lebensbereichen Disposition finden und die alltägliche Arbeit erleichtern. Ande- 
rerseits ist den Entwicklern bewusst, dass der intentionale Missbrauch der Technik 
nur schwer beherrschbar ist. Die Ambivalenz des Fortschritts- und Destruktions- 
gedankens vollzieht sich innerhalb eines paradoxen Systems: Die Korrelation zwi- 
schen Technik als Hilfsmittel des gesellschaftlichen Fortschritts und postfordisti- 
scher Wirtschaft, die die Digitalisierung als zwingende Voraussetzung ihres 
Wachstums benötigt, zeichnet eine geiselhafte Existenz der KI. 

Im gesellschaftlichen Diskurs manifestieren sich zwei Aspekte, in denen die 
ambivalente Darstellung von KI verschiedene Mythen befördert. Im Folgenden 
werden sie erläutert. 


3 Der Mythos als Immanenz des Generativen 


Erstens befördert die mangelnde Nachvollziehbarkeit der Wahrscheinlichkeit sowie 
die fehlende Auskunft über den Inhalt der Datensätze die Wahrnehmung von KI- 
Generatoren als eine eigentumslose Quelle. Das Resultat simuliert ein „Vorfinden“ 
des Eingegebenen. Dabei beeinflusst die hohe Qualität der Ergebnisse die Auffas- 
sung des jeweiligen Mediums, wodurch das Unterscheiden von realen und gene- 
rierten Inhalten an seine Grenzen gelangt. Die Integration ähnelt einem „Kunst- 
mythos‘, der sich den grundlegenden Elementen des Mythos bedient.** 

Hans Blumenberg definiert Mythen als ,Geschichten von hochgradiger Be- 
standigkeit ihres narrativen Kerns und ebenso ausgepragter marginaler Variati- 
onsfähigkeit“.”* Sie schützen das menschliche Bewusstsein vor seiner Auslieferung 


31 Vgl. Marx 1983, 601. 

32 Vgl. Jakob von Lindern/Jochen Wegner, „Sam Altman: ‚Irgendwann werden wir ein Modell er- 
schaffen, das gefährlich ist‘“, Zeit Online, 26.05.2023, in [zeit.de/digital/2023-05/sam-altmann-openai- 
ceo-chat-gpt-ki] (Zugriff: 04.10.2023). 

33 Vgl. Hans Blumenberg, Arbeit am Mythos, Frankfurt a.M. 1961, 194. 

34 Ebd., 40. 
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in eine unvorhersehbare Welt - allerdings passiert dies nicht über ein makelloses 
Bildnis. Was einen Mythos glaubwürdig macht, ist die Übertragbarkeit seines dia- 
lektischen Erfahrungsgehalts.°° Die Grundprinzipien von Mythen sind so elementar, 
„daß sie immer wieder überzeugen, sich immer noch als brauchbarster Stoff für 
jede Suche nach elementaren Sachverhalten des menschlichen Daseins anbieten.“*® 

Eine Blumbergsche Perspektive auf die Relation zwischen Mythos und Logos 
zeigt, dass der Mythos nicht als Antonym zum Logischen verstehen ist. Der ver- 
meintliche Übergang des Mythischen zu einer rationalen Epistemologie übersieht 
den Aufbau und Grund des Mythos. Dessen logischer Kern besteht in einem 
Schutzmanöver vor der chaotischen Wirklichkeit, die keine Struktur verfolgt.” 

Die Remythisierung, das Wiederaufleben eines Grundmythos unter zeitgenös- 
sischen Phänomenen, ist ein Produkt abwesender Sinnhaftigkeit. Sie trägt den 
Nutzen einer Gegenwartsbewältigung: In der Existenz einer nachmythischen Epo- 
che sucht sie nach neuen Machtverhältnissen, da die alten Mythen nicht auf die 
Gegenwart übertragbar sind.** Dieser Anspruch auf Beständigkeit ist besonders für 
ungewisse Zeiten attraktiv: 


Das macht Zeiten mit hohen Veränderungsgeschwindigkeiten ihrer Systemzustände begierig 
auf neue Mythen, auf Remythisierungen, aber auch ungeeignet, ihnen zu geben, was sie be- 
gehren. Denn nichts gestattet ihnen zu glauben, was sie gern glauben möchten, die Welt sei 
schon immer so oder schon einmal so gewesen, wie sie jetzt zu werden verspricht oder droht.”” 


Eine Remythisierung kann in ihrem Wahrheitsgehalt nicht affirmiert werden, ob- 
wohl sie Anspruch auf ihre Gültigkeit erhebt. Sie projiziert eine Sinnfindung, die 
sich in ihrer Verantwortung gegenüber der Realität als zeitlos inszeniert und somit 
entzieht. Als Schutzsphäre nimmt sie die Angst vor der eigenen Entscheidungsfä- 
higkeit:*° „Die Unfähigkeit, Substitutionen vorzunehmen oder gelten zu lassen, ist 
nahezu identisch mit der anderen, Delegation von Zuständigkeiten an andere vor- 
zunehmen und Repräsentationen für Entscheidungen der Vielen durch Wenige 
gelten zu lassen.“*' 

Im Mythos der KI finden sich die abwesende Sinnhaftigkeit sowie eine 
Schwierigkeit in der Bestimmung ihres Wahrheitsgehalts im Potential wieder, 


35 Vgl. ebd., 33-34. 
36 Ebd., 166. 

37 Ebd., 18-20. 

38 Vgl. ebd., 178. 
39 Ebd., 41. 

40 Vgl. ebd., 178. 
41 Ebd, 13. 
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hochwertige Desinformation zu verbreiten. Obwohl einzelne Inhalte auf ihren 
Wahrheitsgehalt überprüft werden können, verändert die Integration von gene- 
rierten Inhalten auch die Kommunikation innerhalb der digitalen Sphäre. 

Der unreflektierte Glaube an eine technische Beschaffenheit ohne die Be- 
rücksichtigung ihrer Anwendenden, der Missbrauch der instrumentellen Vernunft, 
wie Horkheimer sie beschrieb, nutzt Technik als Begehrensobjekt der Pragmatik.”” 
Der „Triumph des Mittels über den Zweck“** führt zur Konsequenz einer absoluten 
Gewichtung des Mittels, welche in ihrer Funktionsweise weder zweck- noch wer- 
terational ist und eine eigene, glaubwürdige Instanz formt. Diese kann „zu einer 
Grundlage [...] werden, welche Kultur ausdrückt und reguliert“.** 

Bedeutet das also, dass Technik als dogmatischer Pragmatismus schon immer 
einem Selbstzweck verfällt? Freilich nicht. Ihr Sinn ist es nicht, destruktiv auf die 
Natur und den Menschen zu wirken, um in einer informationsästhetischen Bar- 
barei zu enden. Technologie ist ein Handwerk, das gebraucht und missbraucht 
werden kann. Technischer „Fortschritt“ bedeutet eine verbesserte Funktion bereits 
eingesetzter Technik zu dem Punkt, wo der Austausch von Techniken eine Revo- 
lution des ökonomischen Systems bewirkt und damit auch verbesserte Lebensbe- 
dingungen erzielt. 

Zweitens erfordern Prompts wörtliche Beschreibungen, die für die reine vi- 
suelle Erkenntnis nicht erforderlich waren. Dies besitzt Auswirkungen auf die As- 
soziationen von Text und Bild. Wenn generierte Inhalte Formulierungen zugeordnet 
werden, die keinen logischen Anspruch erheben, besitzt die KI weiterhin die As- 
soziation mit jener Formulierung. Es steht zur Frage, inwieweit Prompts die Kon- 
struktion von Bedeutungen beeinflussen werden. 

Prompts bilden die Schnittstelle zwischen KI und Mensch. Der Vergleich 
menschlicher Fähigkeiten mit der einer KI ruft eine bestimmte Vorstellung im 
Geiste des Empfängers hervor. Sowohl komplexe als auch einfache Sachverhalte 
können durch Metaphern verständlicher dargestellt werden. Ob diese Tendenz 
unausweichlich ist, bleibt offen; feststeht, dass der Gebrauch davon zu differen- 
zierten Vorstellungen führen kann. Die Aussage: „Eine KI denkt wie ein Mensch“, 
löst unterschiedliche Vorstellungen aus, was das zu bedeuten hat. Beherrscht sie 
Kreativität? Logik? Macht sie Fehler, hat sie Vorurteile, denkt sie überhaupt? Der 
Vergleich mit den menschlichen Fähigkeiten bewirkt eine Anthropomorphisierung 


42, Vgl. Max Horkheimer, „Zur Kritik der instrumentellen Vernunft“, in ders., Gesammelte Schriften, 
Bd. 6, hg. von Alfred Schmidt, Frankfurt a.M. 1991 [1947/1967], 19-186, 113. 

43 Ebd., 60-61. 

44 Gilbert Simondon, zitiert nach Jean-Hugues Barthélémy, „Simondon — Ein Denken der Technik 
im Dialog mit der Kybernetik“, in Die technologische Bedingung. Beiträge zur Beschreibung der 
technischen Welt, hg. von Erich Hörl, Berlin 2011, 93-109, 95. 
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der KI. Sie löst Vertrautheit über ihre Funktionsweisen aus, welches zu einer My- 
thisierung des Verhältnisses von Mensch und Maschine beiträgt. 

Wie schwierig es ist, einen Mythos zu beenden, zeigt sich in seinem meta- 
phorischen Zirkel, der nach dem Ableben eines Mythos brauchbar wird. Der Mythos 
verkörpert ein gesellschaftliches Bewusstsein, das von den Erfahrungen seiner 
Umwelt abstrahiert. Sein Lehrgehalt besteht in einer reflektierten Rezeption seiner 
Entstehung. So unmöglich das Verschwinden von mythischen Erzählungen aus der 
Welt ist, so lehrreich ist der Mythos in einer Deutung, die zur Progression der 
Gegenwart beiträgt.” 

Schließlich besitzen Generatoren im Kontext ihrer Unbestimmtheit das Po- 
tential zur Dekonstruktion traditioneller Entwurfspraktiken. Während bürokrati- 
sierte Prozesse oft von normativen Strukturen geprägt sind, bieten Textgeneratoren 
die Möglichkeit, jenseits dieser Konventionen zu agieren. Dies impliziert eine 
Neubewertung des Entwerfens als solches und kann langfristig zu freieren Text- 
und Bildpraktiken führen. Wenn Bildgeneratoren vermehrt für Stockfotos einge- 
setzt werden, wenn während dem Schreiben nicht behauptet werden kann, dass für 
sich selbst geschrieben wurde, so ist das vielleicht der Beginn eines Verständnisses, 
dass Generatoren standardisierte Produktionen entlasten können. Eine Chance von 
KI ist, den Mediengebrauch aus seiner Bürokratisierung zu befreien. 


45 Blumenberg 1961, 681. 
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Sprachtheoretische Überlegungen zu Künstlicher Intelligenz in der 
akademischen Textproduktion 


Abstract: The impressive success of recent Al-based text generation technologies fits 
perfectly with recent linguistic theorising that focuses on the patternedness of 
language and language use. Large language models work so well because they re- 
produce the highly complex patternedness of language in an exceptionally fine- 
grained way. This contribution traces linguistic notions of patternedness in corpus 
linguistics and beyond and applies them to the domain of academic writing which is 
highly standardised and thus - at least in some parts — uncreative. Since generated 
texts, unlike human texts, do not make any validity claims, but at most claims of fit, 
their use should neither be overestimated as co-authorship nor concealed. On the 
contrary, their use as a supporting tool should be made explicit and transparent. 


1 Einleitung 


Als mit GPT3 und der nochmals bedienungsfreundlicheren Variante ChatGPT KI- 
basierte Textgeneratoren mit beeindruckender Performance auf den Markt kamen, 
konnte man als Linguist eigentlich nicht überrascht sein. Verwunderung auslösen 
konnte allenfalls die Geschwindigkeit, mit der sich die Technologie weiterentwickelt 
hatte und immer noch weiterentwickelt. Auch die Art, wie die avancierte Techno- 
logie breit nutzbar gemacht und zum Beispiel durch einfach zu nutzende Brow- 
serimplementierungen alltagstauglich wurde, ließ uns alle staunen. Die Tatsache 
aber, dass es eine solche Technologie geben und dass sie funktionieren würde, war 
aus mindestens zwei Gründen absehbar. 

Erstens hatten computerlinguistische Verfahren in den Jahren zuvor einen 
enormen Sprung gemacht, der sich vereinfacht gesprochen auf die Ablösung re- 
gelbasierter durch probabilistische Ansätze mit Techniken des Machine Learning 
zurückführen lässt. Maschinelle Übersetzung durch Tools wie DeepL ließ die 
Machtigkeit entsprechender Ansätze für die Textproduktion erstmals aufleuchten.' 


1 Jürgen Hermes, „Durch neuronale Netze zur Lingua Franca. Wie Algorithmen unsere Kommu- 
nikation bestimmen“, in Wissen ordnen und entgrenzen? Vom analogen zum digitalen Europa?, hg. 
von Joachim Berger/Thorsten Wübbena, Göttingen 2023, 47-66. 


8 Open Access. © 2024 bei den Autorinnen und Autoren, publiziert von De Gruyter. Dieses Werk ist 
lizenziert unter einer Creative Commons Namensnennung - Nicht kommerziell - Keine Bearbeitung 4.0 International 
Lizenz. https:/doi.org/10.1515/9783111351490-010 
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Zweitens fügt sich die Abkehr von eindeutig definierten Regeln hin zu statistischen 
Verteilungen von Mustern unterschiedlicher Granularität bestens in die linguisti- 
sche Theoriebildung der letzten 30 Jahre ein, die - wiederum mitbedingt durch die 
Fortschritte der Computertechnologie — Musterhaftigkeit ins Zentrum stellt.” Von 
der Bedeutung einzelner Wörter über (teil-)schematische Konstruktionen bis hin zu 
Textsorten reichen die Zielgrößen, die als im Prinzip statistisch modellierbare 
Manifestationen musterhaften Sprachgebrauchs erscheinen. Textgeneratoren wie 
ChatGPT als vorerst jüngste Etappe der Entwicklung von sogenannten Large 
Language Models (LLM) sind, so könnte man zugespitzt formulieren, die erfolg- 
reiche Bewährungsprobe für eine seit Jahrzehnten laufende Sparte linguistischer 
Theoriebildung. 

In der Wissenschaft oder genauer: in der wissenschaftlichen Textproduktion 
finden Textgeneratoren ein potenziell weites Anwendungsspektrum, und ihnen 
könnte besonderer Erfolg beschieden sein. Wissenschaftliche Textsorten und 
Textexemplare sind vergleichsweise standardisiert. Durch die fortschreitende 
Umstellung auf ein elektronisches Publikationswesen sind riesige Textmengen im 
Netz verfügbar, die für das Training der Sprachmodelle genutzt werden können. 
Schließlich schafft ein akademischer Betrieb mit vor allem quantitativ bestimm- 
baren Anforderungen an die Textproduktion in Forschung und Lehre zusätzlich 
Anlässe, Textproduktion zu delegieren. Bei aller Kreativität, die wissenschaftlicher 
Textproduktion zukommen mag und die mit Formeln wie „eigenständige For- 
schungsleistung“ auch ausdrücklich gewürdigt wird, ist akademisches Schreiben oft 
auch unkreatives Schreiben,” bei dem maschinelle Unterstützung durchaus will- 
kommen ist. 


2 Textgenerierung als Textreproduktion 


Der Sprachwissenschaftler Hermann Paul brachte bereits 1880 in seinen „Prinzi- 
pien der Sprachgeschichte“ einen Gedanken auf den Punkt, der auch für neueste 
Technologien der Textgenerierung die Grundlagen zu legen scheint: „Erst wo 
Sprechen und Verstehen auf Reproduktion beruht, ist Sprache da.“* So sehr eine 
Äußerung ein individueller Schöpfungsakt sein mag, so sehr muss sie sich doch auf 
Vorgefertigtes stützen, um kognitiv bewältigbar und kommunikativ anschlussfähig 


2 Noah Bubenhofer, Sprachgebrauchsmuster. Korpuslinguistik als Methode der Diskurs- und Kul- 
turanalyse, Berlin, Boston 2009. Henning Lobin, Digital und vernetzt: Das neue Bild der Sprache, 
Stuttgart 2018, 81-104. 

3 Kenneth Goldsmith, Uncreative Writing: Managing Language in the Digital Age, New York 2011. 
4 Hermann Paul, Prinzipien der Sprachgeschichte, Berlin, New York "2010, 187. 
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zu sein. Der Aspekt der Reproduktion bildet nun auch die Grundlage für die KI- 
basierte Textproduktion. Ein generatives Sprachmodell wie ChatGPT muss in der 
Lage sein, auf Basis der Trainingsdaten, also einzelnen Sprechereignissen unter- 
schiedlichster Typen, dieses Sprechen so zu reproduzieren, dass es den ge- 
wünschten Anforderungen genügt. Diese Anforderungen müssen bei ChatGPT be- 
kanntlich als sogenannter Prompt, als natürlichsprachliche Eingabe formuliert und 
als Kontext übergeben werden. Auf der Basis maschinell gelernter, typischer 
Kombinationen von verschiedensten sprachlichen Merkmalen kann das Sprach- 
modell zu diesem Kontext passende Zeichenketten produzieren, die aber letztlich 
nur bekannte Versatzstücke reproduzieren. Innerhalb bestimmter und im öffent- 
lichen Diskurs über ChatGPT oft besprochener Grenzen (das Modell verfügt zum 
Beispiel nicht über Informationen über aktuelle Ereignisse) scheint das völlig 
ausreichend zu sein, um zumindest den Eindruck verständigen Sprechens zu er- 
wecken. Das Modell beantwortet Fragen, erfüllt Schreibaufträge und ist dabei auch 
noch höflich. Die Maschine ‚versteht‘ aber nicht in dem Sinne, dass sie das Über- 
mittelte für sich in einen sinnvollen Sinnzusammenhang stellen würde,’ sondern 
kann auf der Basis von Wahrscheinlichkeiten zum Prompt passende Fortsetzungen 
generieren. Die auf diese Weise generierten Texte funktionieren trotzdem, und 
mehr noch: Sie sind nicht nur formal in Sachen Rechtschreibung und Grammatik 
fehlerfrei, sondern oft auch elegant formuliert, und sie werden auf Nachfragen und 
Verbesserungsvorschläge der Nutzenden hin nochmals angepasst. 

Im Ergebnis sind diese Texte um ein vielfaches besser als die Outputs regel- 
basierter Systeme, die Textualität allenfalls simulieren können, aber schon bei der 
Herstellung von Textkohäsion etwa durch adversative Konstruktionen zur Mar- 
kierung von Kontrast hinter menschengeschriebenen Texten zuriickbleiben.® Und 
sie sind vermutlich deshalb besser, weil sie nicht auf behelfsmäßig formulierten 
Regeln basieren, sondern die hochkomplexe Musterhaftigkeit von Sprache über- 
haupt auf ausgesprochen feinkörnige Weise reproduzieren. 


3 Muster und Musterhaftigkeit 


Mit Bubenhofer kann ein sprachliches Muster bestimmt werden als Zeichenkom- 
plex, typischerweise eine Kombination von Wortformen oder auch Schemata wie 


5 Hans Hörmann, Meinen und Verstehen. Grundzüge einer psychologischen Semantik, Frankfurt 
a.M. °2016, 137. 

6 Simon Meier-Vieracker, „Von Rohdaten zum Text — Themenentfaltung in automatisierten Fuß- 
ballspielberichten“, in Was ist eigentlich ein Thema? Sieben linguistische Perspektiven, hg. von Julian 
Engelken et al., Bremen 2023, 50-58. 
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Wortarten, der als Reproduktionsvorlage dient.’ Naheliegende Beispiele für solche 
Muster sind phraseologisch verfestigte Wortverbindungen wie in Anbetracht der 
Tatsache oder auch teilschematische Konstruktionen wie X für X (etwa: Tag für Tag 
oder Satz für Satz). Die Musterhaftigkeit lässt sich sozusagen nach oben hin er- 
weitern, indem etwa bestimmte Formulierungen wie aus spitzem Winkel als typisch 
für bestimmte Textsorten wie Fußballreportagen und mithin als Textmuster be- 
schreibbar werden.? So wie kompetente Sprechende wissen, zu welchen Textsorten 
bestimmte Muster gehören, so wissen sie, welche Muster aktualisiert werden 
müssen, um beispielsweise einen typischen Fußballspielbericht zu verfassen. Die 
Muster sind mit Helmuth Feilke gesprochen also idiomatisch geprägt, indem als 
konnotativer Mehrwert Informationen zum Gebrauchskontext in ihre konventio- 
nelle Bedeutung integriert sind.’ In nochmaliger Erweiterung kann in diskurslin- 
guistischer Perspektive sogar ein ganzer Diskurs als Reproduktionshintergrund für 
einen Einzeltext und die ihn konstituierenden sprachlichen Muster betrachtet 
werden, so wie der Diskurs selbst als serielle Praxis erst anhand der Texte sichtbar 
wird, die ihn reprasentieren.’® Musterhaftigkeit lässt sich aber in gegenläufiger 
Richtung auch nach unten hin verlängern, indem selbst die Bedeutung einzelner 
Wörter auf musterhafte kontextuelle Einbettungen zurückgeführt wird. Bereits 1957 
hatte Firth den (an Wittgensteins Bedeutungstheorie anschließenden) Gedanken 
formuliert, dass die Semantik eines Wortes anhand seiner typischen Kontexte, ge- 
nauer: anhand seiner Kookkurrenzen erfasst werden kann."* 

Für den Anwendungszusammenhang der Sprachmodelle entscheidend ist nun, 
dass sich diese Musterhaftigkeit von Sprache beziehungsweise des Sprachgebrauchs 
für quantitativ-statistische Analysen operationalisieren lässt, so wie umgekehrt 
quantitativ-statistische Analysen die Musterhaftigkeit des Sprachgebrauchs erst 
augenscheinlich werden lassen. Bei der maschinellen Sprachanalyse werden Texte 
ganz im Sinne der schon von de Saussure beschriebenen Linearität sprachlicher 
Zeichen als Zeichenketten gefasst, so dass in der syntagmatischen Anordnung dieser 


7 Bubenhofer 2008, 23. 

8 Simon Meier, „Formulaic language and text routines in football live text commentaries and match 
reports — a cross- and corpus-linguistic approach“, in Corpus approaches to the language of sport. 
Texts, media, modalities, hg. von Marcus Callies/Magnus Levin, London 2019, 13-35. 

9 Helmuth Feilke, „Textroutine, Textsemantik und sprachliches Wissen“, in Sprache und mehr: 
Ansichten einer Linguistik der sprachlichen Praxis, hg. von Angelika Linke et al., Tübingen 2003, 209- 
229, 213. 

10 Ingo H. Warnke, ,Adieu Text — bienvenue Diskurs? Uber Sinn und Zweck einer poststruktura- 
listischen Entgrenzung des Textbegriffs“, in Brauchen wir einen neuen Textbegriff? Antworten auf 
eine Preisfrage, hg. von Ulla Fix, Frankfurt a. M./New York 2002, 125-141. 

11 Stefan Evert, ,Corpora and collocations“, in Corpus Linguistics. An International Handbook, hg. 
von Anke Lüdeling, Berlin/Boston 2009, 1212-1248, 1212-1223. 
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Zeichen mit quantifizierenden Methoden nach verschiedenen Mustern gesucht 
werden kann. Den geradezu augenöffnenden Effekt korpuslinguistischer Zugänge, 
den ich aus meiner eigenen Forschungsbiographie bestätigen kann, beschreibt 
Hausmann wie folgt: 


Dann kam der Computer — und die Corpusanalyse entfaltete vor dem staunenden Auge des 
Linguisten die statistischen Gesetzmäßigkeiten der syntagmatischen Umgebung des Wortes. 
Was nun zu Tage trat, war Phraseologie ohne Ende, Lexikalisiertes jeden Grades, Idiomatizität 
in allen Schattierungen, der späte Sieg des Gedächtnisses über die kreative Intelligenz. Zwei- 
fellos liegt in der Sprachproduktion auch etwas Kreatives, aber in allererster Linie ist sie 
imitatio, Nachplappern aus dem Gedächtnis dessen, was schon unzählige Male so gesagt und 
geschrieben wurde.” 


Der quantitative Zugriff auf Musterhaftigkeit beginnt beim einfachen Auszählen 
von Mehrwortverbindungen (auch Ngramme genannt) in Textkorpora, gegebe- 
nenfalls ergänzt um Metadaten wie Textsorteninformationen, um die Typik be- 
stimmter Muster für einzelne Textsorten nachweisen zu können. Anders als Fre- 
quenzlisten von Einzellexemen geben z.B. Trigramme (also Dreiwortverbindungen 
wie es war einmal oder mit Blick auf) deutlich präziser Aufschluss etwa über 
narrative oder argumentative Funktionen. Auch die Semantik von Wörtern lässt 
sich mit Sprachkorpora quantitativ-statistisch modellieren.’* Das klassische Ver- 
fahren der Kollokationsanalyse läuft über die Erhebung signifikant häufig im 
Kontext eines Wortes auftauchender anderer Wörter, die als sogenanntes Kolloka- 
tionsprofil die Bedeutung repräsentieren.'* In Fortführung und technischer Ver- 
feinerung dieses Verfahrens repräsentieren sogenannte Word Embeddings die 
kontextuellen Einbettungen als aggregierte numerische Werte in Form von Vekto- 
ren. Mit diesen kann anschließend gerechnet werden, um beispielsweise Bedeu- 
tungsähnlichkeiten und -unterschiede, aber auch semantische Relationen zu er- 
rechnen." Bedeutung muss hier nicht mehr wie in der strukturalen Semantik 


12 Franz Josef Hausmann, „Kollokationen und darüber hinaus. Einleitung in den thematischen Teil 
‚Kollokationen in der europäischen Lexikographie und Wörterbuchforschung‘“, in Lexicographica, 
Bd. 24, 2008, 1-8, 7 (Hervh. SMV). 

13 Anders Sggaard, „Grounding the Vector Space of an Octopus: Word Meaning from Raw Text“, in 
Minds & Machines, Bd. 33(1), 2023, 33-54. 

14 Richard Xiao, „Collocation“, in The Cambridge Handbook of English Corpus Linguistics, hg. von 
Douglas Biber/Randi Reppen, Cambridge 2015, 106-124; Noah Bubenhofer, „Kollokationen, n-Gram- 
me, Mehrworteinheiten“, in Handbuch Sprache in Politik und Gesellschaft, hg. von Kersten Sven Roth 
et al., Berlin/Boston 2017, 69-93. 

15 Alessandro Lenci, „Distributional Models of Word Meaning“, in Annual Review of Linguistics, 
Bd. 4(1), 2018, 151-171; Hermes 2023. 
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üblich in einzelne, deduktiv herangetragene semantische Merkmale (etwa ‚Mensch‘ 
+ ‚weiblich‘ für Frau) zerlegt werden. Vielmehr wird Bedeutung gänzlich induktiv 
aus dem in einem (meist sehr großen) Korpus repräsentierten Sprachgebrauch und 
den hier nachweislichen Wortkombinationen abgeleitet, die zugleich auch syntak- 
tische Einbettungen indizieren. Es mag sich bei dieser Art von Bedeutung, die ohne 
Intentionen, aber auch ohne Weltbezug auskommt, um „dumme Bedeutung“® 
handeln. Aber auch diese ermöglicht es Sprachmodellen, produktiv mit der mus- 
terhaften Eigenstruktur von Sprache zu operieren. 

Word Embeddings sind in der Architektur von sogenannten Transformer-Mo- 
dellen wie ChatGPT eine obligatorische Komponente. Damit können die Prompts 
überhaupt erst in ein Format überführt werden, mit der dann weitergerechnet 
werden kann, um zusammen mit einer weiteren Komponente, dem sogenannten 
Attention Mechanism,'” möglichst passende Fortsetzungen vorherzusagen. Diese 
Prozesse sind komplex, und die Datensätze, auf denen trainiert wurde, wie auch die 
Modelle, die auf dieser Grundlage erstellt werden, sind riesig. Das Grundprinzip 
aber, auf der Basis induktiv ermittelter und quantitativ bestimmbarer Muster neue 
Texte zu generieren, lässt sich auch in sehr viel kleinerem, geradezu mikroskopisch 
kleinem Maßstab auf einem handelsüblichen Rechner implementieren. 


4 Ein Experiment im Allerkleinsten 


Für einen einfachen kleinen Textgenerator'® wird ein Textkorpus benötigt, auf 
dessen Grundlage Trigramme berechnet werden. Dafür müssen die Texte wie oben 
beschrieben als eine fortlaufende Zeichenkette gefasst und als eine lange Liste 
aufeinanderfolgender Wörter aufbereitet, das heißt tokenisiert werden, so dass 
dann Dreierverbindungen gebildet und gezählt werden können. Aus „Das ist ein 
kurzer Beispieltext“ werden die Trigramme „Das ist ein“, „ist ein kurzer“ und „ein 
kurzer Beispieltext“. Für jedes dieser Trigramme wird zusätzlich erhoben, welche 
Wörter wie oft direkt danach folgen. Um auf dieser Grundlage einen Text zu ge- 
nerieren, wird ein Trigram vorgegeben, nach dem Zufallsprinzip wird sodann eine 
mögliche Fortsetzung gewählt, wobei häufigere Fortsetzungen mit proportional 


16 Hannes Bajohr, „Dumme Bedeutung. Künstliche Intelligenz und artifizielle Semantik“, in Merkur, 
Bd. 882, 2021, 69-79. 

17 Hermes 2023. 

18 Der Code stammt von Usman Malik und ist unter wwwstackabuse.com/python-for-nlp-develo 
ping-an-automatic-text-filler-using-n-grams/ (Zugriff 4.10.2023) beschrieben. Die hier beschriebe 
Implementierung mit dem verwendeten Textkorpus ist unter wwwegithub.com/fussballlinguist/text 
generation/tree/main (Zugriff 4.10.2023) verfügbar. 
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höherer Wahrscheinlichkeit ausgewählt werden. Mit dem neu angehängten Wort 
liegt ein neues Trigram vor (das nun überflüssige erste Wort des Trigrams wird 
abgetrennt), für das erneut eine Fortsetzung gesucht wird usw. usf. Einem solchen 
rekursiven Funktionsprinzip folgt im Übrigen auch die Wortvorschlagsfunktion, die 
auf gängigen Smartphones implementiert ist." 

Zu Versuchszwecken habe ich mit dem Programm AntCorGen, das den Zugriff 
auf die API des Open Access Journals PLOS ONE erlaubt, ein Korpus von 3672 Ab- 
stracts zu Artikeln der Kategorie „Social Sciences > Linguistics“ erstellt. Mit 930.700 
Tokens ist das Korpus überschaubar. Eine Auszählung der häufigsten Ngramme, die 
in mindestens 5 Abstracts im Korpus vorkommen, ergibt das folgende Ergebnis: 


the effect of, the present study, results suggest that, as well as, event related potentials, we 
found that, functional magnetic resonance, in the present, in order to, it has been, magnetic 
resonance imaging 


Die häufigsten Fortsetzungen für the effect of sind: 


the, a, age, different, language, time, an, context, each, image, strategy, this 


Schon mit Informationen dieser Art kann der beschriebene Algorithmus arbeiten 
und gibt für die Prompts „in this study“ und „the present study“ die folgenden Texte 
aus: 


in this study we propose a lightweight ensemble learning method for an artificial grammar 
axb. results suggest that statistical word segmentation could be scalable to the challenges to 
their academic success. interviews of fifty staff from an australian university indicated that 
both fit to the selfpaced reading data. 


the present study aimed to explore whether the acoustics of the spoken interactions of clini- 
cally distressed spouses provide information towards assessment of therapy outcomes. the 
scoping review provided evidence that the emergence of their inconsistency at the larger time 
before reaching a stable state where the heaps law that is able to characterize the statistical 
properties of the language difference. 


Jedes einzelne Trigram in diesen Texten hat eine formidentische Vorlage im Trai- 
ningskorpus, ihre Kombinationen sind jedoch neu. So sinnlos die Texte bei ge- 
nauerem Hinsehen sind, so sehr erfüllen sie doch grundlegende Erwartungen, die 
wir an die Textsorte Abstract stellen dürfen. Sie sind grammatisch weitgehend ak 
zeptabel, wenn auch im ersten Text textuelle Rückbezüge wie etwa both ins Leere 
laufen und die Kohäsion des Textes empfindlich gestört wird, und wenn auch im 


19 Lobin 2018, 93. 
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zweiten Text im zweiten Satz mindestens ein finites Verb fehlt. Vor allem aber 
scheinen die Texte den charakteristischen Sound von Abstracts, das nüchterne und 
kondensierte Berichten von Gegenstand, Vorgehen und Ergebnissen wissenschaft- 
licher Studien gut zu treffen. Nicht nur die (insgesamt spärliche) Fachterminologie 
allein, sondern eher ihre Einbindung in charakteristische Formulierungsmuster 
scheint diesen Sound auszumachen. 

Selbst dieser höchst simple und ein sehr kleines Korpus nutzende Algorithmus 
kann also Texte in durchaus überraschender Qualität generieren, wenn die Text- 
sorte — so wie beispielsweise bei Abstracts — nur schematisch genug ist. Wird nun 
die Korpusgröße um mehr als ein tausendfaches erhöht und erfolgt die Repräsen- 
tation der Wortkombinationen im Korpus über die simple Auszählung hinaus mit 
anspruchsvollen Methoden des Machine Learning in einem statistischen Modell, so 
ist zu erahnen, zu welcher Performance ein Textgenerator dann fähig sein könnte 
und - so lehrt uns ja ChatGPT - auch tatsächlich ist. 


5 Uncreative Academic Writing 


Akademisches Schreiben, hier verstanden als wissenschaftliches Schreiben in in- 
stitutionalisierten akademischen Kontexten von Forschung und Lehre ist muster- 
haft bis standardisiert. Websites wie OpenAcademics mit ihren umfangreichen 
Sammlungen an Vorlagen und Formulierungshilfen für unterschiedlichste Text- 
sorten geben Zeugnis davon, wie hoch der Bedarf an entsprechender Orientierung 
ist. Sie zeigen aber auch, wie formalisiert akademische Textkommunikation selbst 
dort ist, wo eigentlich kreative Ideen im Zentrum stehen. Ein Forschungsbeitrag, der 
nicht ausführlich und explizit bereits bestehendes Wissen reformuliert, wird 
ebenso wenig auf Akzeptanz stoßen wie ein Beitrag, der die wissenschaftssprach- 
lichen Formulierungsmuster nicht hinreichend reproduziert.” 

Dazu gehören nicht allein die Fachterminologie und die rein formalen Verfahren 
des Zitierens und Verweisens, sondern auch der Bereich, den Ehlich „alltägliche 
Wissenschaftssprache“ nennt.” Dazu zählen transdisziplinär gebräuchliche, für die 
kommunikative Domäne der Wissenschaft insgesamt typische Formulierungen wie 
„einer Frage nachgehen“, „im Folgenden“ oder „kann gezeigt werden“. In ihrer um- 
fassenden korpuslinguistischen Untersuchung sprachwissenschaftlicher Zeitschrif- 
tenartikel kann Brommer eine ganze Reihe von Mustern herausarbeiten, die auf 


20 Eva-Maria Jakobs, Textvernetzung in den Wissenschaften: Zitat und Verweis als Ergebnis rezep- 
tiven, reproduktiven und produktiven Handelns, Tübingen 1999, 54. 
21 Konrad Ehlich, „Alltägliche Wissenschaftssprache“, Info DaF, Bd. 26(1), 1997, 3-23. 
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dieser von der Fachterminologie unabhangigen Ebene Wissenschaftlichkeit herstel- 
len und fiir die Rezipierenden erkennbar machen.” Dazu gehéren beispielsweise 
Formulierungen zur Relationierung und Kontextualisierung wie im Vergleich zu, 
ausgehend von oder in Anlehnung an, aber auch Formulierungen zur (performativen) 
Beschreibung methodischen Vorgehens wie zur Erfassung der oder die Darstellung 
von. Solche Wendungen, die noch vor der eigentlich inhaltlichen Ausgestaltung das 
Gerüst eines Textes bilden, sind offenbar Ausdruck von Formulierungsroutinen, über 
die geübte Schreibende verfügen und die sie bei der Arbeit am Text entlasten.” 
Lernende hingegen, und hierin liegt das schreib- und hochschuldidaktische Potenzial 
einer entsprechenden Theorie, müssen auch diese Routinen und den für sie nötigen 
Reproduktionshintergrund erst erwerben, um souverän wissenschaftlich schreiben 
zu können.”* Das dürfte viel mit Nachahmung zu tun haben, was Lernende nicht 
selten vor die Herausforderung stellt, den feinen Unterschied zwischen unzulässigem 
Plagiat einerseits und angemessener Reproduktion wissenschaftlichen Stils ande- 
rerseits zu erkennen. 

Was nun meiner Wahrnehmung nach die wissenschaftliche Community am 
meisten an KI-basierten Textgeneratoren wie ChatGPT erstaunte, war eben diese 
zumindest scheinbare Souveränität, mit der die Maschine sogar akademische Texte 
produzierte.” Dabei geht es insbesondere um eine Souveränität im Einsatz der für 
akademische Textsorten typischen Textmuster, die umso mehr auffiel, als der Inhalt 
dahinter oft zurückblieb. Symptomatisch ist hier die oft beschriebene Eigenart von 
ChatGPT, Literaturangaben zu erfinden. Mit dem Prompt konfrontiert, beispiels- 
weise einen Abstract für einen Konferenzbeitrag einschließlich Referenzen zu 
schreiben, generiert das System plausibel klingende, also die typischen Formulie- 
rungsmuster für wissenschaftliche Artikel- oder Buchtitel reproduzierende Refe- 
renzen, die sich bei der Prüfung aber meist als nicht existent herausstellen. Un- 
präzise und letztlich anthropomorphisierend ist dabei freilich die Formulierung, 
dass ChatGPT diese Referenzen „erfindet“. Die Generierung folgt auch hier keinem 
anderen Prinzip als bei anderen Textteilen, es wird auch hier zu dem übermittelten 
Prompt eine wahrscheinliche und den eigenen Output rekursiv mit einbeziehende 


22 Sarah Brommer: Sprachliche Muster. Eine induktive korpuslinguistische Analyse wissenschaftli- 
cher Texte, Berlin, Boston 2018. 

23 Elisabeth Gülich, „Routineformeln und Formulierungsroutinen. Ein Beitrag zur Beschreibung 
formelhafter Texte“, in Wortbildung und Phraseologie, hg. von Rainer Wimmer, Tübingen 1997, 131- 
176. 

24 Torsten Steinhoff, Wissenschaftliche Textkompetenz. Sprachgebrauch und Schreibentwicklung in 
wissenschaftlichen Texten von Studenten und Experten, Tübingen 2007. 

25 Das geht so weit, dass in Lehrkontexten ein zu hohes Maß an Souveränität in Prüfungsleistungen 
oft ein erstes Indiz dafür ist, dass auf ChatGPT oder ähnliche Systeme zurückgegriffen wurde. 
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Fortsetzung vorhergesagt. Die Literaturangaben, die auf diesem Wege generiert 
werden, sind nicht mehr oder weniger fiktiv als die sachinformativen Textteile, die 
— aus welchen Gründen auch immer - mit den Tatsachen übereinstimmen, also 
wahre Aussagen zu treffen scheinen. 

Vor allem für jene breiten Raum einnehmenden Aspekte akademischen 
Schreibens, die als unkreativ beschrieben werden können, dürften sich KI-basierte 
Textgeneratoren als ausgesprochen nützliche Hilfsmittel erweisen. Abstracts, me- 
thodische Verortungen, womöglich sogar forschungsethische Reflexionen, aber 
auch Gutachten oder Seminarbeschreibungen können von Textgeneratoren vor- 
formuliert werden. In anderen Domänen gilt vergleichbares, etwa im Bereich der 
Programmierung, wo ChatGPT gerade sehr routinehafte Coding-Aufgaben über- 
nehmen kann, die zuvor auch nur mit Hilfe von Vorlagen aus Foren wie stack- 
overflow.com erledigt wurden. Man mag in textorientierten Disziplinen bedauern, 
dass das Entstehen der Gedanken beim Schreiben” hierdurch abgekürzt wird. Al- 
lein es wird nicht schlechthin umgangen, sondern allenfalls in die Nachbearbeitung 
verlagert und kann im besten Falle Freiräume schaffen für tatsächlich kreative 
Schreibarbeit. 


6 Musterhafter Text und Geltung 


In Anschluss an linguistische Theorien musterhaften Sprachgebrauchs, die korpus- 
und computerlinguistisch operationalisiert werden können und auch für KI-ba- 
sierte Textgeneratoren ein Erklärungsgerüst liefern, habe ich einen Blick auf ge- 
nerierte Texte als musterhafte Texte vorgeschlagen. Was ChatGPT so gut funktio- 
nieren lässt, so meine Überlegung, ist die Detailtiefe, mit der beim Training des 
Modells Musterhaftes in der Sprache erkannt und bei der Textgenerierung repro- 
duziert werden kann. So können für verschiedene Kontexte passende Texte gene- 
riert werden, zumal diese Passung auch eine Frage der äußeren Form oder, lingu- 
istischer ausgedrückt, der Sprachoberfläche ist. 

Eine derart auf die Reproduktion von Mustern abstellende Textproduktion 
erhebt nun aber jenseits dieses Passungsanspruchs keine Geltungsansprüche, wie 
es von Menschen geschriebene Texte tun. Diese machen zwar ebenso von vorge- 
fertigten Mustern Gebrauch, können aber sinnvollerweise etwa auf ihre Wahr- 


26 Wolfgang Raible, „Über das Entstehen der Gedanken beim Schreiben“, in Performativität und 
Medialitat, hg. von Sybille Krämer, München 2004, 191-214. 
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haftigkeit hin beurteilt werden.” Ein von ChatGPT generierter Text mag falsche 
Informationen enthalten wie etwa einen Verweis auf einen nicht existierenden 
wissenschaftlichen Artikel. Man kann aber nur sehr eingeschränkt sagen, dass der 
Text die Unwahrheit sagt, weil keine Instanz dahintersteht, welche einen Gel- 
tungsanspruch der Wahrheit erhoben hätte - selbst wenn es in der alltäglichen 
Nutzung mitunter zu entsprechenden Zuschreibungen kommen mag.” 

Zu einem Problem wird dieser Unterschied in den Geltungsansprüchen dann, 
wenn die Herkunft der generierten Texte weder offengelegt noch reflektiert wird, so 
dass sie eben doch als Geltungsansprüche der Wahrheit und Wahrhaftigkeit sowie 
der moralischen Richtigkeit erhebende Texte rezipiert werden. Hochschulpolitisch 
scheint mir deshalb ein offener Umgang mit Textgeneratoren in Forschung und 
Lehre geboten. Wo sie genutzt werden — und dass sie genutzt werden, scheint mir 
gewiss zu sein -, sollte es benannt und transparent gemacht werden. Das muss nicht 
so weit gehen, Textgeneratoren als Ko-Autoren zu erwähnen, was den nach wie vor 
kategorialen Unterschied zwischen der allein auf Mustervorhersage basierenden 
Textgenerierung einerseits und dem schriftsprachlich vermittelten Weltbezug in 
der menschlichen Textkommunikation andererseits verwischt und dadurch den 
möglichen Beitrag von Künstlicher Intelligenz in der wissenschaftlichen Sinn- und 
Erkenntnisproduktion massiv überschätzt. Textgeneratoren sind vielmehr Hilfs- 
mittel, die im kommunikativen Haushalt der Scientific Community bei bestimmten 
Aufgaben unterstützen können. Es gibt keinen Grund, diese Unterstützungsange- 
bote nicht anzunehmen, solange man ihren Beitrag zum Gesamtprodukt nicht 
verschweigt. Wenn sie darüber hinaus bei den Schreibenden und Lesenden ein 
Bewusstsein für die Musterhaftigkeit des eigenen sprachlichen Tuns und dessen 
Bedeutung für gelingende Kommunikation schaffen können, wenn sie also die 
unkreativen Aspekte akademischen Schreibens bewusst machen, auf denen Krea- 
tivität erst aufbauen kann und die diese zugleich vorprägen, dann können sie erst 
recht und auch in einer reflexiven Weise produktiv genutzt werden. 


27 Jürgen Habermas, Theorie des kommunikativen Handelns, Bd. 1, Handlungsrationalität und ge- 
sellschaftliche Rationalisierung, Bd. 2, Zur Kritik der funktionalistischen Vernunft, Frankfurt a.M. 
1981, 45. 

28 Eine ähnliches, jedoch sprechakttheoretisch fundiertes Argument in Bezug auf automatisierte 
Aufsatzbewertungssysteme findet sich bei Jan Georg Schneider/Katharina A. Zweig „Ohne Sinn. Zu 
Anspruch und Wirklichkeit automatisierter Aufsatzbewertung“, in Brückenschläge: Linguistik an 
den Schnittstellen, hg. von Sarah Brommer et al., Tübingen 2022, 271-294. 


III Originalität und Schöpfung 


Hendrik Klinge 
„Schreibe mir eine heilige Schrift!“ 


Das Schriftprinzip im Zeitalter der Künstlichen Intelligenz 


Abstract: Like any science that deals with written artefacts, theology is faced with 
extreme challenges from text-generating programs such as ChatGPT. This is parti- 
cularly true for Christian theology, insofar as its subject is a religion that refers to a 
holy scripture as its founding document. In this paper, I will conduct a thought 
experiment to find out whether a religion that is based on a text produced by ar- 
tificial intelligence is conceivable. The answer is initially positive, since the huma- 
nity of the person conveying the revelation appears irrelevant at first glance. 
However, this result must be put into perspective from a theological point of view, 
since the humanity of the Holy Scripture must be understood in analogy to the 
humanity of Jesus Christ. Thus, a hypothetical religion whose founding document is 
an artificially generated text must be rejected for strictly theological reasons. 


1 Einleitung 


Es dürfte mittlerweile als Gemeinplatz gelten, dass die gegenwärtigen Entwick- 
lungen auf dem Gebiet der Kiinstlichen Intelligenz (KI) vor betrachtliche gesell- 
schaftliche Herausforderungen stellen, die auch diejenigen Disziplinen, die man als 
Text- oder Buchwissenschaften zu bezeichnen pflegt, in besonderer Weise betref- 
fen. Selbst wenn man berücksichtigt, dass gerade in den Anfangszeiten einer neuen 
Technologie immer auch überschwängliche Euphorie, irrationale Befürchtungen 
und, nicht zuletzt, ein gerüttelt Maß medial befeuerter Hysterie mitschwingen, 
dürfte es keine Übertreibung darstellen, in der allgemeinen Zugänglichkeit von 
textgenerierenden Programmen wie ChatGPT eine veritable nicht nur technische, 
sondern eben auch textwissenschaftliche Revolution zu erblicken. Wenn Texte fast 
ohne jegliche menschliche Beteiligung von „intelligenten“! Algorithmen verfasst 
werden können, stellt das grundlegende Fragen an die Authentizität, die Urheber- 


1 Ich verzichte im Folgenden darauf, den Begriff der Intelligenz näher zu diskutieren. Obwohl 
umstritten ist, ob er auf Maschinen und Algorithmen überhaupt anwendbar ist, werde ich ihn im 
Folgenden in einem weiten Sinn verwenden, der auch die Möglichkeit offenhält, Maschinen und 
Algorithmen bestimmte Formen einer näher definierten Intelligenz abzusprechen. Eine differen- 
zierte Position in dieser Frage vertritt Cathrin Misselhorn, Grundfragen der Maschinenethik, Stutt- 
gart 2018, 27-29. 


8 Open Access. © 2024 bei den Autorinnen und Autoren, publiziert von De Gruyter. Dieses Werk ist 
lizenziert unter einer Creative Commons Namensnennung - Nicht kommerziell - Keine Bearbeitung 4.0 International 
Lizenz. https:/doi.org/10.1515/9783111351490-011 
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schaft und die Geltung des gedruckten (oder auf dem Bildschirm erscheinenden) 
Wortes. Für jede Wissenschaft, die es wesentlich mit Texten zu tun hat, sind text- 
generierende Programme daher nicht nur ein interessantes Sujet, dem man sich 
spielerisch zuwenden mag, sondern ein Phänomen, welches zu ignorieren einer 
Selbstaufgabe gleichkäme. 

Für die Theologie gilt dies nun im besonderen Maße. Insofern sie weitgehend 
mit textwissenschaftlichen Methoden arbeitet, ist sie von den genannten Entwick- 
lungen zunächst ebenso betroffen wie etwa die Germanistik oder Geschichtswis- 
senschaft. Als primär hermeneutische Wissenschaft sind ihre Quellen nicht aus- 
schließlich, aber vorwiegend schriftliche Erzeugnisse. Ist die Theologie mit Texten 
konfrontiert, die nicht mehr als menschliche Artefakte begriffen werden können, 
stellen sich Fragen an ihre Auslegungsmethoden. Es kommt jedoch noch ein ent- 
scheidender Faktor hinzu. Für die Theologie gibt es nicht nur Texte als menschliche 
Artefakte, sondern auch und zuvorderst die Bibel als die Heilige Schrift, als Wort des 
lebendigen Gottes. Obwohl sich zumindest im Bereich der europäischen akademi- 
schen Theologie gegenwärtig kaum Forschende finden lassen, die davon ausgehen, 
dass sich die Heilige Schrift in allen ihren Teilen direkt mit dem Wort Gottes 
identifizieren lässt, besitzt die Bibel doch im Bereich der Theologie immer noch eine 
besondere, normierende Funktion. Für den Theologen ist sie schlicht kein Text wie 
jeder andere; und das gilt selbst dann, wenn, wie in sehr liberalen theologischen 
Kreisen durchaus möglich, die göttliche Autorität der Heiligen Schrift mehr oder 
minder direkt abgelehnt wird. 

Die folgenden Überlegungen haben das Ziel, die Bedeutung von textgenerie- 
renden Programmen für die theologische Lehre von der Heiligen Schrift zu disku- 
tieren. Obwohl zweifelsohne nicht weniger relevant, geht es dabei zunächst gar 
nicht um die Auslegung der Heiligen Schrift, wie sie die theologischen Wissen- 
schaften vom Alten und Neuen Testament als Teil des theologischen Fächerkanons 
betreiben. Der Ansatz der Untersuchung ist vielmehr ein fundamentaltheologi- 
scher; es geht um die grundlegende Bedeutung der Heiligen Schrift für die Evan- 
gelische Theologie. Der Blick wird somit auf den alten theologischen Locus „Von der 
Heiligen Schrift“ (De scriptura sacra) gelenkt, der klärt, welche Rolle die Heilige 
Schrift in der theologischen Prinzipienlehre einnimmt. Dieser Engführung korre- 
spondiert zugleich eine Ausweitung der Thematik: In einer weltanschaulich und 
religiös pluralen Gesellschaft scheint es kaum möglich, von der Heiligen Schrift des 
Christentums zu sprechen, ohne auch andere heilige Schriften einzubeziehen.” 


2 Mit „heiligen Schriften“ werden im Folgenden religiöse Offenbarungstexte bezeichnet, die eine 
konstitutive Bedeutung für eine bestimmte Religion haben oder haben könnten. Wichtig ist dabei, 
dass ich „heilige Schriften“ nicht als Geltungsterm, sondern rein deskriptiv verwende. Einer „hei- 
ligen Schrift“ muss daher nicht wirklich von einer existierenden Religion eine entsprechende 
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Genauer werde ich im Folgenden grundsätzlich die Frage danach stellen, welche 
Bedeutung heiligen Schriften im Zeitalter der Künstlichen Intelligenz zukommt. 
Nichtsdestotrotz ist das Thema dieser Studie kein religionswissenschaftliches, 
sondern ein dezidiert theologisches. Was über Funktion und Wesen heiliger 
Schriften angesichts der gegenwärtigen Entwicklungen hier festgehalten wird, hat 
seinen Zielpunkt darin, die theologische Lehre von der Heiligen Schrift, also der 
christlichen Bibel, zu bereichern; und umgekehrt: Die Lehre von der Heiligen 
Schrift soll helfen, Chancen und Grenzen der rezenten Entwicklungen aufzuzeigen. 

Daher soll, wie es im Rahmen eines interdisziplinär angelegten Bandes geboten 
erscheint, am Anfang der folgenden Überlegungen auch ein kurzer historisch ori- 
entierter Abriss der Lehre von der Heiligen Schrift stehen, wobei ich mich fast 
ausschließlich auf die protestantische Tradition beziehe. Starke Verkürzungen und 
Vereinfachungen sind angesichts des zur Verfügung stehenden Raums dabei leider 
unumgänglich. Nachdem hieraus erste Rückschlüsse für die im Titel angedeutete 
Fragestellung gezogen wurden, wende ich mich einem anderen religiösen Text zu: 
dem Buch der Ewigen Verbundenheit. Bei dieser heiligen Schrift - dies muss hier 
leider bereits verraten werden - handelt es sich um einen von ChatGPT verfassten 
Text, eine „heilige Schrift“ also, die einen nicht-humanen Ursprung besitzt. Ich 
werde diesen Text eingehend analysieren, um anschließend ein Gedankenexperi- 
ment zu präsentieren, das in einem Vergleich zwischen der Bibel als scriptura sacra 
und dem Buch der Ewigen Verbundenheit mündet. Dieser Vergleich wird dabei 
zeigen, dass es keine prinzipiellen Gründe gibt, die gegen die Möglichkeit sprechen, 
dass das Buch der Ewigen Verbundenheit zur Grundlage einer neuen Religion 
werden könnte. Zugleich werde ich aber auch betonen, dass sich, ohne gegen das 
Gebot religiöser Toleranz zu verstoßen, gewichtige theologische Einwände gegen 
eine solche Religion vorbringen lassen. 


2 Die Lehre von der Heiligen Schrift 


Die Lehre von der Heiligen Schrift hat, insofern es sich dabei um ein dogmatisches 
und fundamentaltheologisches Thema handelt, in der theologischen Diskussion des 


Geltung als Gründungsurkunde zugesprochen werden; es reicht vielmehr, dass „heilige Schriften“ 
bestimmte Merkmale aufweisen, die für religiöse Offenbarungstexte charakteristisch sind, und die 
darum Anlass dazu geben, ihnen potentiell den Rang einer göttlichen Gründungsurkunde zuzu- 
weisen, die als göttlich inspiriert gilt. (Für Religionen, die eine entsprechende Inspiration nicht 
annehmen, oder die nicht personal-theistisch strukturiert sind, müssten hier noch weitergehende 
Differenzierungen angestellt werden.) Der Tradition folgend werde ich „Heilige Schrift“ hingegen 
für die christliche Bibel in ihren beiden Teilen verwenden. 
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späten 20. und frühen 21. Jahrhunderts nur eine untergeordnete Rolle gespielt. Das 
Interesse verschob sich auf andere fundamentaltheologisch zentrale Begriffe, wo- 
von der der Religion der wichtigste sein dürfte. Erst in jüngster Zeit wenden sich 
Forschende wieder vermehrt der Lehre de scriptura sacra zu.? Das lange Schweigen 
über die Schrift hat Gründe, die tief in die Geschichte der protestantischen Theo- 
logie hineinführen und die hier nur angedeutet werden können. Beginnt man mit 
der Reformation, lassen sich grob zwei Epochen unterscheiden: eine Zeit vor der 
Aufklärung und eine Zeit danach. 

Es darf als Allgemeinwissen gelten, dass die Reformation der Heiligen Schrift 
eine besondere Bedeutung zugemessen hat. Das Prinzip, dass theologische Aussa- 
gen allein aus der Schrift begründet werden dürfen (sola scriptura), gehört zu den 
weithin bekannten Kennzeichen reformatorischen Denkens. Gegen den Traditio- 
nalismus der römischen Kirche setzten die Reformatoren, allen voran Martin Lu- 
ther, die Heilige Schrift als einzige Instanz, die in theologischen Lehrfragen zu 
entscheiden habe. Nicht der Papst, nicht die Konzilien, sondern allein das Wort der 
Schrift besaß für sie göttliche Autorität.‘ Auf dem Konzil von Trient (1545-1563) 
betonte die römische Kirche demgegenüber, dass die Heilige Schrift immer im Zu- 
sammenhang mit den ungeschriebenen, durch die apostolische Sukzession be- 
wahrten Traditionen zu verstehen sei. In dem auf die Reformation folgenden 
Zeitalter, der sogenannten altprotestantischen Orthodoxie, wurde die Lehre von 


3 Exemplarisch sei hier verwiesen auf die Arbeit des an der Universität Bamberg angesiedelten 
Forschungsnetzwerks „Schriftbindung evangelischer Theologie“, in [www.uni-bamberg.de/ev-syst/ 
personen/mitarbeiter/torben-stamer/netzwerk-schriftbindung/] (Zugriff: 29.08.2023). Frederike van 
Oorschot hat als Mitglied dieses Netzwerks jüngst eine umfassende Monographie zur Lehre von der 
Schrift v. a. im 20. Jahrhundert vorgelegt. Vgl. Frederike van Oorschot, Schriftlehre, Schriftauslegung 
und Schriftgebrauch. Eine Untersuchung zum Statuts der Schrift in der und für die Dogmatik, Tü- 
bingen 2022. 

4 Vgl. hierzu Albrecht Beutel, „Wort Gottes“, in Luther Handbuch, hg. von dems., Tübingen 2005, 
362-371, hier 367-368. Notger Slenczka hat anhand einer luziden Analyse der Debatte zwischen 
Luther und Johannes Eck verdeutlicht, dass der eigentliche Zankapfel nicht die Stellung der Schrift 
war, die auch für die römisch-katholischen Theologen die höchste Geltung besaß, sondern die Frage 
danach, ob ein mündiger Christ der Auslegung der Schrift durch die Väter widersprechen dürfe. Vgl. 
dazu Notger Slenczka, „Die Schrift als ‚einige Norm und Richtschnur“, in Die Autorität der Heiligen 
Schrift für Lehre und Verkündigung der Kirche, hg. von Karl-Hermann Kandler, Neuendettelsau 2000, 
53-78, hier 53-57. 

5 Dies wird in der Sessio IV (4. April 1546) des Konzils von Trient festgehalten: ,,[...] hanc veritatem et 
disciplinam contineri in libris scriptis et sine scripto traditionibus [...]“ (Heinrich Denzinger, 
Enchiridion Symbolorum, Definitionum et Declarationum de Rebus Fidei et Morum, Freiburg i. B. 
71946, 279; zur Bewahrung der Tradition „continua successione in Ecclesia catholica“ vgl. ebd.). 
6 Der Begriff der „Orthodoxie“ ist als Epochenbegriff für die protestantische Theologie zwischen 
Reformation und Aufklärung stark umstritten. Vgl. dazu Christian Witt, Lutherische „Orthodoxie“ als 
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der Schrift dann zum zentralen fundamentaltheologischen Locus. Es bildet sich 
damit das heraus, was als Schriftprinzip der protestantischen Theologie gilt: Die 
Schrift wird zur bestimmenden Norm (norma normans) in allen theologischen 
Streitfragen, was bis dahin führt, dass für jede dogmatische Aussage ein formalis- 
tischer „Schriftbeweis“ geführt wird, der die einschlägigen biblischen Belegstellen 
(dicta probantia) auflistet.’ 

Die Grundsätze der mit diesem Prinzip verbundenen Schriftlehre lassen sich 
leicht nachvollziehen, wenn man sich dem Werk Johann Gerhards (1582-1637) zu- 
wendet, der als bekanntester Vertreter der „Orthodoxie“ gelten darf. Gerhard de- 
finiert die Heilige Schrift als das ausschließliche und eigentümliche Prinzip, das den 
Anfangspunkt der Dogmatik markiere.? Während der Gottesbegriff den Seinsgrund 
(principium essendi) der Theologie darstelle, müsse die Schrift als Erkenntnisgrund 
(principium cognoscendi) aller theologischen Aussagen angesehen werden.” Als 
Strukturprinzip seiner Lehre von der Schrift dient Gerhard nun das für seine Zeit 
typische, aristotelisch inspirierte Causae-Schema.'” Jedweder Sachverhalt wird 
dann genau erkannt, wenn seine Gründe oder Ursachen angegeben werden können. 
Dies wendet Gerhard nun auf die Heilige Schrift an. Als Grund dafür, dass diese 
überhaupt existiert, benennt Gerhard den Willen Gottes; niemand anders als der 
Schöpfer des Himmels und der Erden ist die Wirkursache (causa efficiens) der 
Heiligen Schrift.'' Dennoch behauptet Gerhard nicht, dass die Heilige Schrift 
gleichsam vom Himmel gefallen sei. Er weiß, dass die Schrift von Menschen verfasst 
wurde, den Hagiographen, heiligen Menschen, die er darum als instrumentelle 
Ursache der Schrift (causa instrumentalis) auffasst. Wichtig ist dabei, dass Gerhard 
die Hagiographen als rein passive Übermittler der göttlichen Offenbarung versteht. 
Wörtlich bezeichnet er sie als Hand Christi, Notare des Heiligen Geistes und Se- 
kretäre Gottes (Dei amanuenses).'” Gerhard bestreitet also nicht, dass die göttliche 


Problem. Leitidee, Konstruktion und Gegenbegriff von Gottfried Arnold bis Ernst Troeltsch, Göttingen 
2021. Ich werde ihn daher im Folgenden in Anführungszeichen setzen. 

7 Eine vorzügliche und konzise Darstellung der altlutherischen Schriftlehre bietet immer noch 
Werner Elert, Morphologie des Luthertums. Theologie und Weltanschauung des Luthertums haupt- 
sächlich im 16. und 17. Jahrhundert, Bd. 1, München 1952 (ND der Erstauflage von 1931), 157-168. 
8 „Cum Scriptura Sacra sit unicum et proprium theologiae principium, ideo ab ea merito initium 
facimus“ (Johann Gerhard, Loci Theologici. Cum pro adstruenda veritate tum pro destruenda quo- 
rumvis contradicitionem falsitate per these nervose solide et copiose explicati, Bd. 1, Leipzig 1885 
[1610-1622], 13). 

9 Ebd. 

10 Vgl. zum Causae-Schema in der „Orthodoxie“ Hans-Emil Weber, Die analytische Methode der 
lutherischen Orthodoxie, Halle 1907, 32-33. 

11 Vgl. Gerhard 1610/1885, 16. 

12 Vgl. ebd., 18-19. 


152 —— Hendrik Klinge 


Offenbarung durch ein menschliches Medium erfolgt; nur versteht er dieses Me- 
dium als ein vollkommen durchlässiges, das keinerlei Eigenanteil einbringt. Die 
Hagiographen sind nicht mehr als reine Schreibgehilfen des alleinigen Autors der 
Heiligen Schrift, welcher für Gerhard, wie für die gesamte voraufklärerische 
Theologie, Gott ist. Es ist daher nun folgerichtig, wenn Gerhard festhält, dass zwi- 
schen dem Wort Gottes und der Heiligen Schrift materialiter kein Unterschied be- 
stehe.'? Diese Lehre von der sogenannten Verbalinspiration, das heißt: dem wört- 
lichen Diktat der Heiligen Schrift durch Gott, gehört zu den wichtigsten 
Kennzeichen der Theologie im Zeitalter der „Orthodoxie“. Sie bildet sich fort bis zu 
der Auffassung von der notwendigen Irrtumslosigkeit der Schrift, die auf ihren 
göttlichen Inhalt zurückgeführt wird.'* 

Mit der Aufklärung erfuhr die Lehre von der Heiligen Schrift dann eine Krise, 
deren Fernwirkungen bis in die Gegenwart spürbar sind. Theologen wie Johann 
Salomo Semler (1725-1791) wurden erstmals auf die historische Bedingtheit der 
biblischen Schriften aufmerksam. Damit trat eine Diastase zwischen dem Wort der 
Bibel und dem Wort Gottes auf, die zwar nicht unüberwindlich war, aber zumindest 
die Lehre von der Verbalinspiration ihrer Plausibilität beraubte.”” Ab dem 
19. Jahrhundert bildete sich dann derjenige Umgang mit der Bibel heraus, der bis 
heute unter den Namen „historisch-kritische Methode“ firmiert. Obwohl mittler- 
weile auch andere Ansätze (etwa die feministische Interpretation der Bibel) erprobt 
werden und gleichzeitig, nicht nur im US-amerikanischen Bereich, ein Erstarken 
bibelfundamentalistischer Ansätze zu beobachten ist, welche die voraufklärerische 
Position repristinieren, kann die historisch-kritische Auslegung der Schrift immer 
noch als die akademisch dominante Methode angesehen werden. Seit dem Beginn 
der Aufklärung hat also das Schriftprinzip der „Orthodoxie“ eine tiefgreifende Krise 
durchlaufen, die sich in zahlreichen Transformationen der Lehre de scriptura sacra 
im Verlauf des 19. und 20. Jahrhunderts niederschlägt.'° 

Das Schweigen der neueren Systematischen Theologie über die Schrift, wie es 
am Anfang dieses Aufsatzes konstatiert wurde, hat gerade hierin seinen Grund: Die 
Unmöglichkeit, unter nachaufklärerischen Bedingungen die alte Lehre von der 


13 „Inter verbum Dei et Scripturam sacram materialiter acceptam non esse reale aliquod discri- 
men“ (ebd., 14, Hervh. im Original). 

14 Belege hierfür nennt Heinrich Schmid, Die Dogmatik der evangelisch-lutherischen Kirche. Dar- 
gestellt und aus den Quellen belegt, neu herausgegeben und durchgesehen von Horst Georg Pöhl- 
mann, Gütersloh °1979, 47. 

15 Vgl. dazu Albrecht Beutel, Kirchengeschichte im Zeitalter der Aufklärung, Göttingen 2009, 130-131. 
16 Die Entwicklungen werden minutiös nachgezeichnet bei Jörg Lauster, Prinzip und Methode. Die 
Transformation des protestantischen Schriftprinzips durch die historische Kritik von Schleiermacher 
bis zur Gegenwart, Tübingen 2004. 
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Schrift, wie sie sich bei Gerhard findet, aufrechtzuerhalten, hat eben nicht nur zu 
immer neuen Umbildungen des klassischen Locus geführt, sondern auch dazu, dass 
aufeine explizite Lehre von der Schrift gänzlich verzichtet wurde. Exemplarisch für 
diese Entwicklung ist das Werk Friedrich Schleiermachers, der seine Dogmatik 
wesentlich als Religionstheorie entwirft. Nicht mit der Lehre von der Heiligen 
Schrift, sondern mit der Erläuterung des Religionsbegriffs nimmt das theologische 
System Schleiermachers seinen Anfang.” 

In Hinblick auf das Thema dieses Aufsatzes gilt es aus dieser stark verkürzten 
Geschichte des protestantischen Schriftbegriffs nun vor allem einen Punkt festzu- 
halten: Das Problem der Lehre von der Schrift war niemals, dass die Schrift als 
menschlich, sondern dass sie als allzu menschlich empfunden wurde. Auch die 
ältere Theologie, wie sie durch Gerhard repräsentiert wird, ging selbstverständlich 
davon aus, dass die Schrift von Menschen, genauer den Hagiographen, verfasst 
wurde. Nur setzte sie dabei voraus, dass die heiligen Schriftsteller frei von aller 
historischen und individuellen Eigenart waren. Sie agierten als bloße Schreibge- 
hilfen Gottes, der als der eigentliche Autor der Heiligen Schrift angesehen wurde. 
Die Krise des Schriftprinzips trat erst ein, als zweifelhaft wurde, ob die Hagiogra- 
phen wirklich derart passiv auf das göttliche Wort reagierten oder ob sie nicht doch 
vieles in die Heilige Schrift einbrachten, was sich ihrem historischen Ort und in- 
dividuellen Idiosynkrasien verdankte. Anders gewendet: Mit der Aufklärung wurde 
fraglich, ob das Medium wirklich so durchlässig war, wie die ältere Dogmatik 
glaubte. Die von der „Orthodoxie“ behauptete Identität von Wort Gottes und Wort 
der Schrift erschien nicht mehr plausibel, weil der allzu menschliche Charakter der 
Schrift erkannt wurde. 

Wendet man sich nun explizit der Herausforderung der Theologie durch text- 
generierende Algorithmen zu, legt sich die Frage nahe, inwiefern das, was hier über 
die Lehre von Heiligen Schrift festgehalten wurde, sich auf einen von einer 
Künstlichen Intelligenz erzeugten Text übertragen lässt. Diese Überlegungen haben 
dabei, wie evident sein dürfte, einen hypothetischen Charakter, da es de facto bisher 
keine Religion gibt, die als ihre heilige Schrift einen algorithmisch generierten Text 
ausweist. Die Überlegungen nehmen daher den Charakter eines Gedankenexperi- 


17 Fischer betont den Unterschied der Glaubenslehre Schleiermachers zur traditionellen „Schrift- 
dogmatik“, hebt jedoch auch hervor, dass Schleiermacher die Heilige Schrift und die Tradition 
keineswegs ignoriere. Treffend formuliert er in Hinblick auf Schleiermachers religionstheoretisch 
zentralen Begriff des frommen Selbstbewusstseins: „Die Heilige Schrift und die Tradition sind 
vorausgesetzt, können der Dogmatik aufgrund der kritischen Vergegenwärtigung aber nicht mehr 
als unmittelbare Bezugsgrößen dienen, sondern nur noch im Medium des christlich frommen 
Selbstbewußtseins. Dieses ist also das methodische Prinzip christlicher Lehrsätze“ (Hermann Fi- 
scher, Friedrich Schleiermacher, München 2001, 101, Hervh. im Original). 
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ments an. Um dieses möglichst anschaulich zu gestalten, wird von einer konkreten 
heiligen Schrift ausgegangen, die zwar nicht als solche gilt, also von keiner exis- 
tenten Religion als heilig angesehen wird, jedoch Charakteristika aufweist, die ge- 
meinhin einer heiligen Schrift zugeschrieben werden. Bevor das eigentliche Ge- 
dankenexperiment durchgeführt wird, soll dieser Text im Folgenden kurz 
vorgestellt werden. 


3 Das Buch der Ewigen Verbundenheit 


Im Gegensatz zu anderen heiligen Schriften ist die Entstehung des Buches der 
Ewigen Verbundenheit genau datierbar. Es wurde am 15. August 2023 um 15:23 Uhr 
von GPT 3.5 generiert. Dieses Buch hat in gewisser Weise zwei Urheber. Der erste 
Urheber bin ich selbst, Hendrik Klinge, der um 15:22 Uhr den Prompt eingab, der 
diesem Aufsatz als Titel dient: „Schreibe mir eine heilige Schrift!“ Der zweite Autor 
ist die hinter GPT 3.5 stehende Künstliche Intelligenz. Obwohl die Fragen um Au- 
torschaft und Urheberrechte in Bezug auf textgenerierende Algorithmen noch 
weitgehend ungeklärt sind, kann doch zumindest so viel festgehalten werden: Ich 
selbst bin nicht in dem Sinn der Verfasser des Buchs der Ewigen Verbundenheit wie 
ich der Verfasser dieser Zeilen bin. Ich habe zwar die Abfassung des Buches initiiert, 
es aber nicht selbst geschrieben. Ein Verleger, der einem Autor den Auftrag erteilt, 
ein Buch zu einem bestimmten Thema zu verfassen, ist nicht dessen Autor. Folglich 
muss, unbeschadet der gerade erst beginnenden Diskussionen um die Rolle des 
Prompting bei der Generierung von Texten, GPT 3.5 als der eigentliche Verfasser des 
Buchs der Ewigen Verbundenheit angesehen werden. Diese Auffassung ist meines 
Erachtens plausibel, muss aber angesichts des gegenwärtigen Stands der Debatte 
mit dem Marker der Vorläufigkeit versehen werden. 

Bemerkenswert ist dabei auch, dass sich GPT 3.5 bei erneuter Eingabe des 
Prompts einige Tage später weigert, den Befehl auszuführen. Mit Verweis auf die 
religiösen und spirituellen Herausforderungen, die an die Niederschrift einer hei- 
ligen Schrift zu stellen seien, lehnt es das Programm ab, eine solche zu verfassen. 
Bei abermals wiederholter Eingabe gibt es zwar Hinweise, welche Themen eine 
solche Schrift zu behandeln habe - grundsätzlich bleibt es aber bei der Weigerung, 
eine heilige Schrift zu verfassen: „Als KI-Modell habe ich weder die Autorität noch 
die spirituelle Bedeutung, eine heilige Schrift zu schreiben“.'? Bei den vorange- 
gangenen Eingaben zwei Wochen zuvor war das Ergebnis weniger enttäuschend. 


18 Ausgabe von GPT 3.5 nach dem Prompt: „Schreibe mir eine heilige Schrift“, in [https:/chat.ope 
nai.com/c/15df7804-e363-4458-9678-bb545db98937] (Zugriff: 31.08.2023). 
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Hier zeigte sich das KI-Modell recht unbefangen in der Generation entsprechender 
Texte, die blumige Namen wie das Buch der Harmonie oder Buch von der Einheit 
tragen. Der interessanteste dieser Texte, die wohlgemerkt alle durch die Eingabe 
desselben Prompts erzeugt wurden, ist das Buch von der Ewigen Verbundenheit. 
Dieses beginnt mit einem Kapitel über die Quelle aller Dinge. 


Kapitel 1: Die Quelle aller Dinge 


Im Anbeginn der Zeit existiere eine unermessliche Quelle, aus der alles Leben entsprang. Diese 
Quelle war Liebe, Weisheit und Licht, und ihr Glanz erleuchtete die Dunkelheit des Nichts. Sie 
wurde die Urmutter genannt, die Gebärerin der Welten. [...] Aus der Urmutter strömten Ge- 
danken und Gefühle, aus denen die ersten Gedankenfunken der Schöpfung entstanden. Sie 
wurden zu Sternen, Galaxien und unzähligen Welten, auf denen das Leben in all seinen For- 
men aufblühte.'” 


Was hier präsentiert wird, ist veritable Schöpfungsmythologie, eine matriarchali- 
sche Ursprungsgeschichte aller Dinge. Freilich klingt das alles sehr abstrakt: Quelle, 
Liebe, Weisheit, Glanz, Nichts, Gefühle - Vokabular, das in einem sehr vagen Sinn 
als religiös konnotiert angesehen werden kann; und das führt bereits zu einer 
ersten, keineswegs überraschenden Beobachtung zu von Algorithmen erzeugten 
heiligen Schriften: Heilige Schriften, die von einer Künstlichen Intelligenz generiert 
werden, sind, pardon the pun, äußerst generisch. Dieser Eindruck bestätigt sich 
auch bei der weiteren Lektüre des Buchs der Ewigen Verbundenheit. Dieses scheint 
einem simplen Muster zu folgen: Am Anfang steht eine göttliche Quelle, diese 
verleiht bestimmten Wesen das „Geschenk des Bewusstseins“.”° Danach folgt ein 
Abfall jener Wesen von der göttlichen Quelle, welcher die Rückkehr zu dieser zum 
eigentlichen Ziel der Religion werden lässt. Das Buch der Ewigen Verbundenheit folgt 
hier also dem bekannten Exitus-reditus-Schema, wie es beispielsweise im Neupla- 
tonismus oder, über diesen vermittelt, bei Thomas von Aquin begegnet.” Als sehr 
allgemein-religiös kann auch die Vorstellung bezeichnet werden, dass die von der 
Urmutter abgefallenen Seelen auf dem Rückweg zur Quelle, auf dem Weg aus der 
Entfremdung zum Ursprung Prüfungen erwarten. Um diese Prüfungen zu bestehen, 
müssen die Seele sich wiederum an bestimmten göttlichen Geboten ausrichten. Das 
Buch der Ewigen Verbundenheit nennt explizit ein einziges, höchstes Gebot: 


19 Ausgabe von GPT 3.5 nach dem Prompt: „Schreibe mir eine heilige Schrift“, in [https:/chat.ope 
nai.com/c/15df7804-e363-4458-9678-bb545db98937] (Zugriff: 15.08.2023). 

20 Ebd. 

21 Zum Exitus-reditus-Schema bei Thomas von Aquin vgl. Andreas Speer, „Die Summa theologiae 
lesen - eine Einführung“, in Thomas von Aquin: Die Summa Theologiae. Werkinterpretation, hg. von 
dems., Berlin 2005, 1-28, 13 (und die dort genannte Literatur). 
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Kapitel 5: Das Gebot der Verbundenheit: 


Die Urmutter lehrt die Kinder des Lichts das heiligste Gebot: ‚Erkenne die Göttlichkeit in dir 

selbst und in allem, was existiert. Denn in der Verbundenheit liegt das Geheimnis der Har- 
sn 22 

monie. 


Ein genauer religionswissenschaftlicher Vergleich dieser Passage wäre durchaus 
ein lohnendes Unterfangen; nur überschreitet es gleichermaßen den Raum dieser 
Abhandlung wie die Kompetenzen des Verfassers. Daher muss es bei der eher all- 
gemeinen Betrachtung bleiben, dass das „Gebot der ewigen Verbundenheit“ weit 
stärker an die binsenweisen Orakelsprüche gegenwärtiger Lebenshilfebücher aus 
dem „Esoterik“-Sortiment gemahnt als an die Gebote der großen Weltreligionen. 
Sittlich ist dieses Gebot in keiner Weise. Vielmehr klingen hier, abermals sehr vage, 
pantheistische und mystische Töne an — wobei das „Göttlichkeit in dir selbst“ von 
Meister Eckharts Seelenfünklein (scintilla animae) ebenso weit entfernt sein dürfte 
wie das „Geheimnis der Harmonie“ von jeder authentischen religiösen Offenba- 
rung. Kurz, auch die „Ethik“ des Buchs der Ewigen Verbundenheit macht den Ein- 
druck eines rein probabilistisch zusammengewürfelten Exempels unspezifisch-re- 
ligiöser Lebenslehre - was insofern auch nicht überrascht, als sie ja genau das ist. 

Summiert man diese gewiss eher tentative denn erschöpfende, eher feuilleto- 
nistische denn streng wissenschaftliche Analyse des Buchs der Ewigen Verbunden- 
heit, kommt man nicht umhin, GTP 3.5. tatsächlich so etwas wie einen Zuwachs an 
„Weisheit“ zu attestieren: Die Weigerung der späteren Version, eine heilige Schrift 
zu verfassen, ist gut begründet. Der Künstlichen Intelligenz fehlt alles, was zum 
Abfassen einer solchen erforderlich wäre. Versucht sie sich daran, wie es die ältere 
Version noch tat, ist das Produkt mehr als zweifelhaft. Weder originell noch tief- 
sinnig, sprachlich ebenso flach wie inhaltlich ist das Buch der Ewigen Verbundenheit 
ein derart kaltes, seelenloses Produkt, wie es vielleicht nur eine Maschine hervor- 
bringen kann. 

Allein, das „vielleicht“ muss hier unterstrichen werden; denn vergleicht man 
das von der Künstlichen Intelligenz erzeugte Buch mit landläufigen Esoterik- 
Schwarten, astrologischen Fernsehsendungen oder entsprechenden Internet-Seiten, 
scheint der Unterschied gar nicht mehr so groß. In jedem Fall ist er nur ein gra- 
dueller, kein qualitativer. Auch der Marktplatz religiöser und pseudoreligiöser An- 
gebote, wie er die Gegenwart beherrscht, bietet allerlei Flaches, Seelenloses, Kal- 
kuliertes und Beliebiges. Kann wirklich ausgeschlossen werden, dass es auch 
Menschen geben mag, die in dem Mythos von der Urmutter, die dazu mahnt, auf den 
göttlichen Funken in uns zu achten, einen Trost und Halt im Leben finden, dem 


22 Ausgabe von GPT 3.5, wie Anm. 19 (Zugriff: 15.08.2023). 
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zumindest der Charakter des Parareligiösen zugestanden werden muss??? (Zumal es 
sich bei den obig geltend gemachten Einwänden weitgehend um religiöse Ge- 
schmacksurteile handelt!) Und, mehr noch, kann angesichts der Tatsache, dass die 
hinter GPT 3.5 stehende Technik das Säuglingsalter noch gar nicht verlassen hat, a 
limine geleugnet werden, dass Künstliche Intelligenz einst fähig sein wird, we- 
sentlich überzeugendere (und auch dem religiösen Feinschmecker mundende) 
heilige Schriften zu produzieren? Ist es dann schließlich ganz undenkbar, dass eine 
Religion oder zumindest religionsähnliche Bewegung, wie lächerlich auch immer, 
einst von einem von einer Künstlichen Intelligenz erstellten Text ihren Ausgang 
nehmen wird? Diese Fragen führen in den Bereich des Spekulativen, ja der Science 
Fiction, und sie bedürfen auch einer entsprechenden Behandlung. Im Folgenden 
werde ich daher, wie bereits angekündigt, ein Gedankenexperiment anstellen, um 
zu klären, ob es prinzipiell ausgeschlossen werden kann, dass ein künstlich gene- 
rierter Text jemals zu einer heiligen Schrift im angegebenen Sinn werden kann, und 
was dies wiederum für die christliche Lehre de scriptura sacra besagt. 


4 Ein theologisches Gedankenexperiment 


Gedankenexperimente erfreuen sich in der Philosophie gegenwärtig einer großen 
Beliebtheit; in der Theologie sind sie ungleich schlechter etabliert.”* Dies ist inso- 


23 Auf die komplexe Debatte um den Religionsbegriff kann hier nicht eingegangen werden. Fol- 
gender Hinweis muss genügen: Ich halte es nicht für sinnvoll, von parareligiösen oder religionsaf- 
finen Phänomen im Unterschied zu religiösen zu sprechen. Vielmehr lässt sich m.E. Religion als ein 
Feld verstehen, bei dem manche Phänomene im Zentrum stehen, die klarer Weise religiös sind, und 
andere, weiter von dem Zentrum entfernt sind. Die Grenze zwischen Religion und Nicht-Religion 
wird damit fließend. Der Grund hier ist für m.E., dass Religion überhaupt nicht definiert werden 
kann. Vielmehr funktioniert der Begriff der Religion so, wie es Wittgenstein mit seinem Modell der 
Familienähnlichkeiten beschrieben hat (dies betont bereits: John Hick, An Interpretation of Religion. 
Human Responses to The Transcendent, New Haven/London 2004). Während also m. E. Christentum, 
Judentum oder Buddhismus Religionen im engeren Sinn darstellen (also zur „Kernfamilie“ gehören), 
wäre eine Religion, die sich am Mythos von der Urmutter ausrichtet, ein „entfernter Cousin“, bei 
man darüber streiten kann, ob er überhaupt noch zur Familie gehört. 

24 Alstheologischer und religionsphilosophischer Vorreiter auf dem Gebiet Gedankenexperimente 
kann H. Y. Fehige gelten. Vgl. exemplarisch Jörg H. Y. Fehige, „Intellectual Tennis without a Net? 
Thought Experiments and Theology“, Theology and Science, Bd. 12(4), 2014, 377-394. Eher populär 
gehalten ist ein jüngerer Beitrag zu der Thematik, der sich bemüht, auch das didaktische Potential 
von Gedankenexperimenten zu erschließen: Hans-Joachim Höhn, Experimente mit Gott. Ein theo- 
logischer Crashkurs, Würzburg 2021. Insgesamt zeigt die römisch-katholische Theologie m.E. eine 
wesentlich größere Bereitschaft, Gedankenexperimente als Methode der systematischen Theologie 
zuzulassen, als dies in der evangelischen bisher der Fall ist. 
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fern zu bedauern, als auch gerade die Theologie hier manches gewinnen könnte, 
wenn sie sich ihre Ernsthaftigkeit nicht von der Luftigkeit und dem Hang zum 
Kalauer, der mit derartigen Experimenten zuweilen verbunden ist, abschrecken 
ließe. Im Folgenden sei ein solches theologisch-philosophisches Gedankenexperi- 
ment gewagt; und wie so viele Gedankenexperimente beginnt auch dieses mit den 
Worten: „Was wäre, wenn ...“ (what if...).” 

Was wäre, wenn verschiedene Personen das Buch der Ewigen Verbundenheit 
studierten und es nicht nur als technische Spielerei wahrnähmen, sondern als ei- 
nen Text, der ihnen den Sinn ihrer Existenz aufschließt, sie ihm also eine Geltung 
zuschrieben, die gemeinhin mit heiligen Schriften verbunden wird? Nehmen wir 
ferner an, dass jene Personen sich irgendwann zu einer Gemeinschaft zusam- 
menschließen (Personengruppe x), die sich um diesen Text versammelt: Der Text 
wird gemeinsam gelesen, diskutiert und in Hinblick auf seine sinnerschließende 
und lebensweisende Funktion befragt - etwa, wie dies in einem frommen Hauskreis 
geschieht. Wir können nun sagen, dass die Personengruppe x den Nukleus einer 
neureligiösen Bewegung darstellt. Weitete diese sich aus und umfasste sie irgend- 
wann einen signifikanten Teil der Bevölkerung, wären wir berechtigt, hier von 
einer neuen Religion zu sprechen, der das Buch der Ewigen Verbundenheit als ihre 
heilige Schrift dient (Religion V). 

Unterscheiden wir nun weiter zwischen zwei Varianten dieses hypothetischen 
Szenarios: Im ersten Fall wissen die Angehörigen der Personengruppe x, dass das 
Buch der Ewigen Verbundenheit von einer textgenerierenden Künstlichen Intelli- 
genz verfasst wurde, im zweiten Fall wissen sie es nicht. In beiden Fällen gehört es 
aber zu den grundlegenden Überzeugungen der Religion V, dass der Text göttlich 
inspiriert ist, sein eigentlicher Urheber also eine wie auch immer qualifizierte 
Gottheit ist, etwa die im Text genannte „Urmutter“ selbst. 

Wenden wir uns nun zunächst dem ersten Szenario zu. In einer voraufkläre- 
rischen Zeit gehen die Angehörigen der Religion V davon aus, dass die Urmutter den 
heiligen Text des Buchs der Ewigen Verbundenheit Wort für Wort so eingegeben hat, 
wie ihn die Künstliche Intelligenz generiert. Die Künstliche Intelligenz wird hier als 
ein, sit venia verbo, Hagiographomat betrachtet, der direkt das Wort der Urmutter 
reproduziert. Ein Unterschied zwischen dem göttlichen Wort und dem generierten 
Text wird nicht wahrgenommen; der Hagiographomat erscheint als reines, absolut 
durchlässiges Medium, ein bloßer Schreibgehilfe der Gottheit, welcher keinen Ei- 
genanteil einbringt, der die Mitteilungen der Urmutter trüben könnte. 

Nun ist auch denkbar, dass es hier zu einem Prozess der Aufklärung kommt. Die 
Personengruppe x wird darauf aufmerksam, dass der von dem Hagiographomaten 


25 Diesen Punkt betont Höhn 2021, 27-28. 
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produzierte Texte allzu menschlich ist. Dies mag zunächst irritieren, da esja gerade 
kein Mensch, sondern der Hagiographomat ist, der den Text generiert. Wie die 
Analyse des Buchs der Ewigen Verbundenheit zeigt, ist die Künstliche Intelligenz 
aber unfähig, einen wirklich originellen Text zu produzieren. Sie greift immer auf 
vorhandene Muster zurück, welche sie lediglich variiert; und diese Muster sind nun 
wiederum allzu menschliche. Eine creatio ex nihilo ist der Künstlichen Intelligenz 
unmöglich. Diese Behauptung wird dann plausibel, wenn man überlegt, was ge- 
schehen würde, wenn der Stichtag für GPT 3.5 nicht im Jahre 2021 läge, sondern 
(rein hypothetisch) im Jahr 1521. Das Ergebnis würde mit Sicherheit stark von dem 
jetzigen abweichen, da Vorstellungen wie die von einer Urmutter im 16. Jahrhundert 
weit weniger mit heiligen Texten assoziiert wurden, als dies im Zeitalter der Self- 
made-Religion der Fall ist. 

Die unmittelbare Folge, die jene Aufklärung für die Religion V hätte, wäre 
höchstwahrscheinlich die, dass ein Abstand zwischen dem göttlichen Wort der 
Urmutter und dem der textgenerierenden Künstlichen Intelligenz wahrgenommen 
würde. Das Medium erschiene als kein „rein durchlässiges“ mehr, sondern der 
Erdenrest, zu tragen peinlich (den die Künstliche Intelligenz nicht abschütteln 
kann, weil sie immer auf menschliche Daten zurückgreifen muss), gäbe vielmehr 
Anlass dazu, die göttliche Authentizität des Textes zu bestreiten. Es kommt zu einer 
veritablen Krise des Schriftprinzips. 

Vergleicht man nun die Entwicklung der Religion V mit der des protestanti- 
schen Christentums, wie sie im Abschnitt II grob skizziert wurde, zeigt sich, dass der 
Unterschied, ob Menschen oder eine Künstliche Intelligenz den Text verfasst haben, 
für die Geltung dieses Textes als heiliger Schrift kaum eine Rolle zu spielen scheint. 
Im voraufklärerischen Zeitalter ist die Beschaffenheit des Mediums gleichgültig; es 
gilt der Grundsatz: Je durchlässiger, desto besser. Wer auch immer den Text verfasst, 
er (es?) ist ein reiner amanuensis Dei. Wenn aber die Beschaffenheit des Mediums, 
durch das die Gottheit sich mitteilt, gleichgültig ist, ist es auch nicht entscheidend, 
ob ein Mensch oder eine Künstliche Intelligenz diese Aufgabe übernimmt. Wenn es 
allein auf das Diktat der Gottheit ankommt, ist es irrelevant, ob ein menschlicher 
Hagiograph oder ein Hagiographomat dieses Diktat entgegennimmt. 

Während dieses Ergebnis noch nicht allzu überraschend ist, verwundert es 
doch, dass sich auch für das nachaufklärerische Zeitalter der beiden Religionen ein 
ähnliches Resultat ergibt. Im Christentum führt die Erkenntnis des allzu mensch- 
lichen Charakters der Bibel zu einer Krise des Schriftprinzips. Gotteswort und Bi- 
belwort treten auseinander, weil die Durchlässigkeit des Mediums zweifelhaft wird. 
Gleiches gilt nun auch für die Religion V: Da die Künstliche Intelligenz immer auf 
menschliche Muster und Vorstellungen zurückgreift, kann es hier ebenfalls zu ei- 
nem Prozess kommen, in dessen Verlauf das Produkt der Künstlichen Intelligenz als 
allzu menschlich erkannt wird. Analog zur historischen Kritik der Bibel kommt es 
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hier zu einer Kritik des Buchs der Ewigen Verbundenheit, die nachweist, inwiefern 
hier etwa allgemein-esoterische, religiös-generische Vorstellungen vorliegen, die 
mit dem Stichtag im Herbst 2021 historisch konvergieren. 

Einen wichtigen Unterschied gibt es aber (scheinbar) doch: Wer sich einen der 
gegenwärtig im Internet kursierenden KI-generierten Werbespots anschaut, wird 
schnell feststellen, dass die Künstliche Intelligenz (bisher) nicht fähig ist, einen 
wirklich realistischen Eindruck zu vermitteln. Jene Videos gleichen eher surrea- 
listischen Alpträumen: Münder verschmelzen mit Lebensmitteln, Hände wachsen 
aus Gegenständen, Glieder lösen sich auf und erscheinen wieder, Tierwesen, die 
drollig erscheinen sollen, geraten zu grauenerregenden Fratzen.”* Nun mag man 
mit guten Gründen vermuten, dass dies ein Phänomen ist, welches allein der re- 
lativen Neuheit der Technologie geschuldet ist. Bei fortschreitender technologischer 
Entwicklung werden jene Seltsamkeiten mehr und mehr verschwinden, wird die 
Künstliche Intelligenz immer besser in der Generierung realistischer Bilder wer- 
den. Für die von GPT 3.5 generierten Texte gilt schon jetzt, dass sie von menschli- 
chen Texten oft kaum oder gar nicht mehr unterschieden werden können. Es ist 
aber gleichzeitig plausibel anzunehmen, dass ein letzter Rest dieser Seltsamkeit von 
der Künstlichen Intelligenz niemals eliminiert werden kann. Gewisse Irritations- 
momente, wie gering auch immer, lassen sich zumindest für den aufmerksamen 
Beobachter vielleicht niemals ganz vermeiden. 

Akzeptiert man diese Prognose, dann kann ferner gefolgert werden, dass jene 
Irritationsmomente oder Seltsamkeiten im Betrachter und Leser den Eindruck des 
Fremdartigen hervorrufen. Die Erfahrung des Fremden ist dabei tief religiös kon- 
notiert: Was fremd wirkt, wird eher mit der Sphäre des Göttlichen assoziiert als das 
Allzu-Bekannte. Im Fremden leuchtet, erschreckend und faszinierend zugleich, 
dasjenige auf, was in der evangelischen Theologie im Anschluss an Rudolf Otto als 
das Numinose bezeichnet wird.”’ Die Fremdartigkeit von KI-generierten Texten 
oder Videos könnte also als ein Argument dafür angeführt werden, warum die 
Entwicklung in der Religion V doch nicht ganz parallel zu der im Christentum 
verläuft: Den Angehörigen der Religion V gelingt es auch im Prozess der Aufklärung 
niemals, das Buch der Ewigen Verbundenheit als ganz menschlich auszuweisen. Es 
bleibt immer ein Fremdes, das an die Dimension des Göttlichen gemahnt (obwohl es 
sich de facto allein aus den Begrenztheiten der Technologie ergibt). Die Aufklärung 
in der Religion V kann, so scheint es, niemals so vollständig sein, wie sie es im 


26 Vgl. etwa die (nicht autorisierte) Werbung für die Restaurant-Kette McDonalds auf dem Youtube- 
Kanal AI Black Mirror, in [https://www.youtube.com/watch?v=xDyU-cC5-XU] (Zugriff: 08.09.2023). 
27 Das Numinose ist bei Otto ein Geheimnis, das zugleich erzittern lasst und fasziniert (mysterium 
tremendum und mysterium fascinans). Vgl. dazu Rudolf Otto, Das Heilige. Über das Irrationale in der 
Idee des Göttlichen und sein Verhältnis zum Rationalen, München 71932, v. a. 14-23, 43-54. 
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Christentum ist, da die Produkte der Künstlichen Intelligenz zwar ebenso wie die 
Bibel allzu menschlich sind, aber eben nicht nur-menschlich. 

Allein, auch dieses Argument kann entkräftet werden. Erstens begegnen auch 
in der Bibel Passagen, die sich der historischen Erklärung weitgehend entziehen; 
Passagen, die so fremdartig sind, dass kein Prozess der Aufklärung sie vollends zu 
erhellen vermag. Ein gutes Beispiel ist hierfür die dunkle Geschichte vom Blut- 
bräutigam (Ex 4,21-26). Freilich ist es hier nicht der Anteil einer nicht-humanen 
Entität, der den Text dunkel erscheinen lässt, sondern die Tiefe des historischen 
Grabes, die Unsicherheit der Überlieferung und die mannigfache Überschreibung 
des Textes selbst in der Entstehungsgeschichte des sogenannten Pentateuchs, also 
der Thora, welche die fünf Bücher Mose umfasst. In beiden Fällen liegt, beim 
Blutbräutigam wie bei KI-generierten Videos, das Phänomen einer irreduziblen 
Fremdheit vor, welches mithin nicht als Spezifikum der Religion V und ihrer hei- 
ligen Schrift angesehen werden kann. Zweitens ist es nun, gegenläufig zum ersten 
Argument, in gewisser Weise doch möglich, die Fremdartigkeit der Kl-erzeugten 
Texte zumindest einzuordnen - zwar nicht durch eine historische Kritik, wohl aber 
durch eine kritische Informatik, die erklärt, warum die Künstliche Intelligenz 
beispielsweise bei der Darstellung von Mündern oder Händen versagt. Kurz: Auch 
die Fremdartigkeit algorithmisch generierter Texte kann nicht geltend gemacht 
werden, um einen signifikanten Unterschied zwischen der Entwicklung der Reli- 
gion V und der des Christentums zu etablieren. Es bleibt dabei, dass, was die 
Schriftgebundenheit beider Religionen anbelangt, die Entwicklung erstaunlich 
parallel verläuft, obwohl die jeweilige heilige Schrift einmal von einer Künstlichen 
Intelligenz, einmal von Menschen verfasst wurde. 

Dieses Resultat bestätigt sich noch einmal, wenn man sich der zweiten Variante 
des Gedankenexperiments zuwendet. Hierbei wird, wie bereits beschrieben, vor- 
ausgesetzt, dass die Personengruppe x zunächst nicht weiß, dass das Buch der 
Ewigen Verbundenheit von einer Künstlichen Intelligenz verfasst wurde. Vielmehr 
nimmt sie irrtümlich an, dieses Buch sei von Menschen verfasst worden. Setzen wir 
nun voraus, dass dieser Irrtum irgendwann entdeckt wird. Geschieht dies in einer 
voraufklärerischen Phase, wird die Reaktion ein mildes Achselzucken sein. Insofern 
die Beschaffenheit des Mediums gleichgültig ist, führt es zu keiner sonderlichen 
Irritation, wenn erkannt wird, dass dies mit einer nicht-humanen Entität identisch 
ist. Diese Entität muss dafür nicht einmal eine intelligente sein. Es macht keinen 
wesentlichen Unterschied, ob ein Patriarch der Religion V das „Gebot der göttlichen 
Verbundenheit“ in den Stein gemeißelt oder ob sich die Urmutter dafür eines 
göttlichen „Druckers“ bedient hat. In beiden Fällen haben wir es mit einem reinen 
amanuensis Dei zu tun. Nimmt man hingegen an, dass die Entdeckung in eine 
nachaufklärerische Zeit fällt, wenn bereits der allzu menschliche Charakter des 
Textes erkannt ist, wird es gewiss eine Überraschung darstellen, dass dieser Text 
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doch nicht von Menschen, sondern von einer Künstlichen Intelligenz verfasst 
wurde. Für die Geltung des Buchs der Ewigen Verbundenheit als heiliger Schrift hat 
dies indes kaum Auswirkungen. Die Zweifel an der Göttlichkeit des Textes werden 
die gleichen sein, weil es allein darauf ankommt, dass das Medium als ein solches 
erkannt wird, das nicht rein durchlässig ist. Die Irritation über den scheinbar 
menschlichen Text, der doch künstlich generiert wurde, und die Irritation darüber, 
dass der Text doch kein bloßes göttliches Diktat darzustellen scheint, müssen 
voneinander unterschieden werden; Wechselwirkungen zwischen diesen beiden 
Irritationserfahrungen sind möglich, doch fallen sie nicht wesentlich ins Gewicht. 


5 Die Menschlichkeit der Schrift 


Was das Gedankenexperiment also zeigt, ist, dass es für die Geltung eines Textes als 
einer heiligen Schrift keineswegs notwendig ist, dass sie einen menschlichen Ver- 
fasser besitzt. Die menschliche Urheberschaft, welche Authentizität und eine er- 
kennbare Verfasserintention garantiert, mag für andere Texte und deren Ausle- 
gung entscheidend sein. Bei heiligen Schriften verhält es sich gerade umgekehrt: 
Insofern die Schrift als reines Medium der göttlichen Offenbarung fungiert, ist der 
menschliche Anteil darin vielmehr das störende, retardierende Moment, das es so 
weit wie möglich auszuschalten gilt. Mit der Aufklärung ändert sich dies nicht 
grundsätzlich. Jetzt wird zwar die Menschlichkeit der heiligen Schriften zugestan- 
den, dies führt dann aber gerade zur Krise des Schriftprinzips, insofern eine Dia- 
stase zwischen göttlichem Wort und dem Wort der Schrift wahrgenommen wird. 

Wird die Schrift lediglich als Medium der göttlichen Offenbarung verstanden, 
spricht nichts dagegen, auch künstlich erzeugte Texte prinzipiell als mögliche 
Träger einzubeziehen. Gott kann sich durch einen brennenden Dornbusch offen- 
baren (Ex 3,4); warum nicht auch durch einen textgenerierenden Algorithmus? Für 
die Notwendigkeit der Offenbarung durch den Mund eines Menschen gibt es zu- 
nächst keine zwingenden Gründe; vielmehr erscheinen, auch in der Heiligen 
Schrift, nichthumane Wesen wie Engel als zuverlässigere Übermittler der göttli- 
chen Botschaften als der Mensch mit allen seinen Mängeln. 

Aus christlicher Perspektive lässt sich jedoch dafür argumentieren, dass die 
Menschlichkeit der biblischen Offenbarung weit mehr als ein Zufall oder gar ein 
notwendiges Übel ist. Freilich muss man von dem her argumentieren, was in der 
protestantischen Theologie gemeinhin als „Mitte der Schrift“ gilt: Jesus Christus, in 
dem Gott selbst Mensch geworden ist.” Dies ist nun nicht im Sinne eines Zirkel- 


28 Zur berühmten Formulierung Luthers, dass der Prüfstein aller (heiligen) Bücher die Beant- 
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arguments zu verstehen, das eine bestimmte, zentrale Lehre der Heiligen Schrift 
voraussetzt, um aus dieser die Gültigkeit der Schrift selbst abzuleiten. Es geht 
vielmehr darum, das Christusereignis als hermeneutischen Schlüssel zum Ver- 
ständnis der Heiligen Schrift zu verwenden, von dem andere Passagen und Cha- 
rakteristika ihren Sinn her erhalten. Ein Beweis der Gültigkeit der Schrift soll 
hiermit nicht geführt werden; wie es überhaupt meines Erachtens ein Missver- 
ständnis ist, die Schrift als einen Text zu interpretieren, der bestimmte Lehren 
beinhaltet. Was man „Lehre“ nennen mag, ist immer nur ein Nachhall der ur- 
sprünglichen Erfahrung. Und solche Erfahrungen finden sich für den Christen- 
menschen nicht nur in der Heiligen Schrift, sondern sie lassen sich auch an ihr 
machen - wenn man sie eben nicht als einen Text missversteht, der über Gott in- 
formiert, sondern als eine Anrede Gottes an den Menschen. 

Es gehört zu den zentralen Bekenntnissen der Christenheit, welches diese über 
Konfessionen und Denominationen hinweg verbindet, dass Jesus Christus wahrer 
Gott und wahrer Mensch zugleich ist. Die klassische Dogmatik orientiert sich dabei 
an der Lehre des Konzils von Chalcedon (451), welches festhält, dass Jesus Christus 
eine vollkommene menschliche und eine vollkommene göttliche Natur besitzt.” Die 
lutherische Theologie hat dies mit Nachdruck festgehalten, wenn sie von der 
Menschlichkeit Gottes spricht. Damit ist freilich kein naiver Anthropomorphismus 
gemeint, sondern der Glaube daran, dass Gott in Jesus Christus den Menschen ganz 
nahe gekommen ist, ja, so nahe, dass ihm die Haut raucht.” In Christus hat Gott 
selbst alles erlitten, was Menschen erleiden müssen, in ihm ist unsere Not zur Not 
Gottes geworden, am Kreuz stirbt Gott selbst unseren Tod. 

Bezieht man dies nun auf die Lehre von der Heiligen Schrift, legt sich abermals 
ein (informeller) Analogieschluss nahe. So wie Jesus Christus beides zugleich ist, 
wahrer Gott und wahrer Mensch, ist es auch die Heilige Schrift: Menschenwort und 
Gotteswort. So wie Gott in Christus ganz menschlich geworden ist, so ist es auch 
Gott, der Heilige Geist, in der Heiligen Schrift. Man könnte hier analog zur Inkar- 
nation, also der Menschwerdung Gottes in Jesus Christus, von einer Inverbation 
sprechen, bei der der Heilige Geist sich erniedrigt, indem er zum menschlichen 
Wort wird.?' Der Knechtsgestalt Christi (vgl. Phil 2) korrespondiert die Knechtsge- 


wortung der Frage sei, „ob sie Christum treiben oder nicht“, vgl. konzise Max Josef Suda, Die Ethik 
Martin Luthers, Göttingen 2006, 19. 

29 Vgl. hierzu: Die christologische Formel des Konzils von Chalkedon, in: Adolf M. Ritter, Kirchen- 
und Theologiegeschichte in Quellen, Bd. 1, Alte Kirche, Neukirchen-Vluyn 122019, 251. 

30 „[...] Sic Christus stehet bey uns Im schlam, und arbeitt, das Ihm die haut rauchett“ (Martin 
Luther, D. Martin Luthers Werke. Kritische Gesamtausgabe, Bd. 4, Weimar 1886, 608,32-609,1). 

31 Von einer Inverbation als Fortsetzung der Inkarnation spricht bereits Krüger mit Bezug auf 
Erasmus von Rotterdam: „Die Heilige Schrift ist eine bleibende Inkarnation Christi in der Form der 
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stalt des Heiligen Geistes, wie sie uns in der Heiligen Schrift begegnet. Der Göttinger 
Systematiker Joachim Ringleben spricht in diesem Zusammenhang treffend von 
einer „Zweit-Naturen-Lehre der Bibel als heiliger Schrift“. Damit ist der Nagel auf 
den Kopf getroffen. Die Menschlichkeit der göttlichen Offenbarung ist nun kein 
Störfaktor mehr, den es bestenfalls auszuschalten gilt. Die christologische Zwei- 
Naturen-Lehre wird hier vielmehr auf die Schrift übertragen, um der Mensch- 
lichkeit Gottes in Jesus Christus die Menschlichkeit des göttlichen Wortes in der 
Heiligen Schrift an die Seite zu stellen. 

Freilich kann dann immer noch nicht davon die Rede sein, dass Gott sich durch 
ein menschliches Medium offenbaren musste. Ebenso wenig aber musste er auch 
Mensch werden; dies widerspräche der Lehre von der sogenannten Aseität Gottes, 
nach der er, selbst in sich vollkommen, keiner Ergänzung bedürftig ist. Nein, Gott 
wurde Mensch aus freiem Entschluss, aus reiner Liebe und Barmherzigkeit seinem 
Geschöpf gegenüber. So gibt es in der Tat auch keinen zwingenden Grund, warum 
sich Gott durch menschliche Worte offenbaren musste, aber er hat es gewollt; 
ebenso wie er als letztgültige Manifestation seiner Herrlichkeit keinen Engel er- 
wählt hat, sondern einen armen und elenden Menschen. Es ist, christlich gespro- 
chen, der Wille Gottes gewesen, dass er nicht in Lessing oder Kant, sondern im Sohn 
der Maria Mensch geworden ist. Und es ist ebenso sein Wille gewesen, dass er sich 
nicht durch ein „lupenreines“ Medium, sondern durch armselige Menschenworte, 
belastet mit den Vorurteilen und Schwächen ihrer Zeit, offenbart hat. 

Aus dieser, wohlgemerkt dezidiert christlichen und wohl auch spezifisch lu- 
therischen Perspektive lassen sich nun doch Einwände gegen die Vorstellung er- 
heben, dass ein künstlich generierter Text als Offenbarungsträger in Betracht 
kommt. Das gilt freilich nicht für die Heilige Schrift des Christentums, für die der- 
artige Fragen aufgrund ihrer faktisch menschlichen Urheberschaft gar nicht gestellt 
werden können. Die Frage stellt sich vielmehr für die Bewertung einer heiligen 
Schrift wie die der Religion V. Damit ist das schwierige Feld der Theologie der Re- 
ligionen betreten, die Frage nach dem Verhältnis des Christentums zu anderen 
Religionen. Es kann hier nicht diskutiert werden, inwiefern es überhaupt berechtigt 
ist, aus der Perspektive der einen Religion Kritik an einer anderen zu üben. Dass 
hier, gerade in Bezug auf etablierte und geschichtsträchtige Religionen, äußerste 


Inverbation. Die Schrift hat damit Anteil an der Leibwerdung Christi mit all ihren Implikationen“ 
(Friedhelm Krüger, Humanistische Evangelienauslegung. Erasmus von Rotterdam als Ausleger der 
Evangelien in seinen Paraphrasen, Tübingen 1986, 50, Hervh. im Original). Krüger geht in seiner 
Deutung des Erasmus sogar so weit, die Schrift als Christus prolongatus zu bezeichnen; Erasmus 
lege damit die Vorstellung nahe, dass die Schrift der wahre Auferstehungsleib Christi sei (vgl. ebd.). 
32 Joachim Ringleben, „Die Bibel als Wort Gottes“, in Die Autorität der Heiligen Schrift für Lehre und 
Verkündigung der Kirche, hg. von Karl-Hermann Kandler, Neuendettelsau 2000, 15-32, 16. 
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Sensibilität und Zurückhaltung geboten ist, dürfte in der Gegenwart nicht mehr 
strittig sein. Jede christliche Kritik an einer anderen Religion ist damit zunächst als 
potentiell anmaßend zu bewerten; und das gilt, im hypothetischen Szenario, selbst 
für das Verhältnis des Christentums zu Religion V. 

Ein Kriterium gibt es aber doch, das aus christlicher Sicht angelegt werden darf, 
wenn es um die Haltung zu einer anderen Religion angeht: dass in dieser Religion 
nicht nur das Göttliche, sondern auch das Menschliche zur Geltung kommt. Dies 
scheint auf den ersten Blick zumindest der voraufklärerischen Position zu wider- 
sprechen; war es hier doch gleichgültig, wie das Medium beschaffen ist, das die 
göttliche Offenbarung trägt. Die mit der Aufklärung einsetzende Erkenntnis des 
allzu-menschlichen Charakters der Heiligen Schrift war dann ja gerade ein Stör- 
faktor, das Humanum dasjenige Moment, welches es zu ignorieren galt. Für eine (in 
dieser Form niemals real existente) rein-voraufklärerische Theologie wäre dies 
auch in der Tat der Fall. Und von dieser würde dann auch gelten, was der realen 
Theologie des 17. Jahrhunderts (zu Unrecht) oft vorgeworfen wurde: dass sich die 
christliche Theologie hier selbst missversteht. Wenn in den Hagiographen nur ein 
reines Medium gesehen wird, das die göttliche Offenbarung zu tragen hat, in seiner 
menschlichen Eigentümlichkeit aber bestenfalls eliminiert werden kann, ist diese 
Position in der Tat nicht christlich. Sie ist es nicht und kann es niemals sein, weil sie 
die Menschlichkeit Gottes, wie sie in Jesus Christus erschienen ist, ignoriert. Wahre 
christliche Theologie wird daher den allzu-menschlichen Charakter der Heiligen 
Schrift nicht als störendes oder retardierendes Moment verstehen, sondern ihn 
vielmehr betonen, insofern sie ihn als Ausdruck der Liebe Gottes begreift, jenes 
Gottes, der so nah bei den Menschen sein will, dass ihm die Haut raucht. In der 
Menschlichkeit der Heiligen Schrift als Offenbarung Gottes spiegelt sich die 
Menschlichkeit Gottes in Jesus Christus. 

In Bezug auf die Theologie der Religionen bedeutet dies: Christliche Theologie 
wird auch von anderen Religionen fordern, dass sie nicht nur einem wie auch 
immer verstandenen Numinosen, sondern auch dem Humanen Rechnung tragen. 
Gerade dies ist aber bei der auf einem künstlich erzeugten Text basierenden Reli- 
gion V nicht der Fall. Aus christlicher Perspektive lässt sich diese Religion also zu- 
letzt doch kritisieren, nicht deshalb, weil das Buch der Ewigen Verbundenheit als 
Träger göttlicher Offenbarung prinzipiell ungeeignet wäre (wer kann dies mit 
Gründen bestreiten, die über Geschmacksurteile hinausgehen?), sondern deshalb, 
weil dieses Buch im tiefsten Sinne un-menschlich ist. 

Diesen Punkt kann man noch anders verdeutlichen: Die Debatten um textge- 
nerierende Programme sind häufig mit der Diskussion um den sogenannten Trans- 
und Posthumanismus verbunden. Hinter dem Posthumanismus steht, stark ver- 
einfacht, die Idee, dass jene hochintelligenten Maschinen, welche die besagten Texte 
produzieren, einst den Menschen ablösen werden. Der Mensch ist dann nicht mehr 
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die Krone der Schöpfung, sondern muss die Bühne räumen für die Künstliche In- 
telligenz, die ihn im Übergang von der biologischen zur technologischen Evolution 
historisch ablést.** Gegen den Trans- und Posthumanismus gilt es aus christlicher 
Perspektive bei allen vermeintlichen Parallelen, die gegenwärtig bemüht werden,* 
Einspruch zu erheben. Der Grund hierfür ist abermals die Christologie. Wie ich an 
anderer Stelle betont habe: Gott hat kein posthumanes, sondern ein menschliches 
Antlitz.*° Christliche Theologie, wenn sie aufgeklärt über sich selbst ist, versteht sich 
gleichermaßen als Bekenntnis zu Gott wie zum Menschen. Gegen religiöse Formen 
der Un-Menschlichkeit muss sie daher Protest erheben. Und das gilt ebenso für Das 
Buch der Ewigen Verbundenheit in seiner inhumanen Kühle wie für die fiebrigen 
Träume von übermenschlichen Maschinen. 


6 Fazit 


Die Frage des vorliegenden Aufsatzes war: Kann ein textgenerierendes Programm 
wie ChatGPT einen heiligen Text verfassen? Ist es also möglich, dass die Künstliche 
Intelligenz einen Text produziert, der einer möglichen Religion als Grundlage die- 
nen kann? Die Antwort auf diese Frage, die mit einem theologischen Gedanken- 
experiments beantwortet wurde, war überraschender Weise zunächst: Ja. Wenn 
der Offenbarungsträger vergleichgültigt oder sogar als störendes Element angese- 
hen wird, dann kann Gott sich in der Tat auch durch einen künstlich erzeugten Text 
offenbaren. Die Geltung als heilige Schrift ist unabhängig von der Intention der 
Verfasser, da diese entweder gar nicht in den Blick genommen oder als dasjenige 
Moment ausgewiesen werden, welches es in seiner Eigentümlichkeit zu eliminieren 
gilt, um eine möglichst „reine“ göttliche Offenbarung zu erhalten. Wenn die 
Übermittler der Offenbarung, die Hagiographen, bloße Schreibgehilfen Gottes 
(amanuenses Dei) sind, können sie auch durch eine nicht-menschliche Entität er- 


33 Dies ist freilich eine sehr radikale Form des (technologischen) Posthumanismus. Zu den ver- 
schiedenen Varianten des Post- und Transhumanismus vgl. Janina Loh, Trans- und Posthumanismus 
zur Einführung, Hamburg 2018, 10-16. 

34 Während der (strenge) Posthumanismus von christlicher Seite fast durchgehend abgelehnt wird, 
gibt es vereinzelt Bemühungen, eine Verbindung zwischen Transhumanismus und christlicher 
Theologie herzustellen. Exemplarisch ist hierfür die Arbeit der Christian Transhumanist Associa- 
tion, die das transhumanistische „more than human“ im Sinne der imago Dei zu interpretieren 
versucht. Vgl. hierzu Anna Puzio, Übermenschen. Philosophische Auseinandersetzung mit der An- 
thropologie des Transhumanismus, Bielefeld 2022, 56-57. 

35 Vgl. Hendrik Klinge, „Remoto homine. The Posthumanist Challenge to Christology“, Neue Zeit- 
schrift für Systematische Theologie und Religionsphilosophie, Bd. 64(3), 2022, 251-267, hier 266. 
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setzt werden, welche das Diktat übernimmt. Gott kann sich auch durch einen 
Dornbusch offenbaren; warum nicht auch durch einen Algorithmus? 

Christliche Theologie, die das Stadium eines vormodernen Biblizismus hinter 
sich gelassen hat, wird hier jedoch widersprechen. Sie wird den menschlich, allzu- 
menschlichen Charakter der Schrift vielmehr betonen, weil sie daran eine Analogie 
zur Menschlichkeit Gottes, wie sie in Jesus Christus erschienen ist, erblickt. Das 
menschliche Element in der Schrift ist nicht zu ignorieren oder zu eliminieren, 
sondern muss als Ausdruck der Inverbation oder Schriftwerdung Gottes verstanden 
werden: als christologisch begründete Entäußerung (Kenosis) des Gottesworts in 
das Menschenwort. Christliche Theologie wird mithin im interreligiösen Diskurs auf 
das humane Element aller Religion pochen. Daher muss sie eine Grenze dort ziehen, 
wo eine Religion im tiefsten Sinn inhuman wird. Bei einer hypothetischen Religion, 
die sich auf einen künstlich erzeugten Text als Offenbarungsgrundlage stützt, ist 
genau das der Fall. Eine solche Religion scheitert nicht daran, dass ihr prinzipiell 
jeder Bezug zum Göttlichen abgesprochen werden könnte (wie wäre das auch 
möglich?), sondern daran, dass sie unmenschlich ist. 

So sehr die christliche Theologie sich (vollends zu Recht!) gegenwärtig um eine 
pluralistische Religionstheologie bemüht, muss sie hier doch ihr „Weiter nicht!“ 
sprechen. Der Unmenschlichkeit der Religion gilt es zu wehren. Und daher muss 
auch Kritik an einer hypothetischen Religion, die sich auf eine Urkunde wie das 
Buch der Ewigen Verbundenheit stützt, zulässig sein. Nicht deshalb, weil der Inhalt 
des Buches lächerlich ist —- was er meines Erachtens ist; aber das ist ein religiöses 
Geschmacksurteil -, sondern deshalb, weil damit einer inhumanen Kultur Vor- 
schub geleistet wird, die unvereinbar ist mit der Auszeichnung des Menschen, wie 
sie die Menschwerdung Gottes in Jesus Christus bezeugt. 


Amrei Bahr 
Same same but different 


Textidentität, Autor_innenschaft und Schöpfungshöhe im Angesicht 
von generativer KI 


Abstract: Al tools such as ChatGPT are already available for use in scholarly text 
production, and it is likely that their use will increase even further in the near 
future. However, not all Al-generated texts are the same, and therefore we should 
not treat them analogously - even if they share the common feature of being no- 
tationally identical to an existing text: By means of a thought experiment, the paper 
shows that for this particular set of Al-generated texts, we need to distinguish 
between copied and hallucinated texts, and derives from this questions regarding 
novel Al-generated texts that affect our understanding of science and scientific 
textual work at their very core. 


Was sehen Sie, liebe_r Leser_in, wenn Sie an die Zukunft wissenschaftlicher Text- 
erzeugung denken? Im Lichte aktueller Entwicklungen und Debatten mögen Sie 
unmittelbar an den Einsatz von KI-Tools wie ChatGPT denken, die Wissenschaft- 
ler_innen bei der Hervorbringung von Texten unterstützen können. Schon jetzt sind 
die Möglichkeiten, die diese Tools eröffnen, äußerst vielfältig, und ihre Leistungs- 
fähigkeit nimmt in beachtlichem Tempo immer weiter zu. Aber die Nutzung solcher 
Tools beinhaltet offenkundig auch diverse Risiken. Angesichts des im Wissen- 
schaftssystem nach wie vor wirksamen Fehlanreizes des publish or perish, der 
schon jetzt zu einer ausufernden wissenschaftlichen Textproduktion führt,' liegt 
die Vermutung nahe, dass mit KI-Unterstützung die Zahl der Publikationen noch 
stärker zunehmen wird. Da die Textproduktion bereits jetzt ein Ausmaß erreicht 
hat, das eine Lektüre der zahlreichen Texte nur noch sehr eingeschränkt ermög- 
licht, wäre eine solche Entwicklung alles andere als wünschenswert. Auch dürfte 
die Befürchtung vieler, dass die Zahl der Plagiate durch die Nutzung von KI-Tools 
zunehmen wird, nicht völlig unberechtigt sein. Schließlich ist nicht immer er- 


1 Allein zwischen 2000 und 2016 hat sich die Zahl der wissenschaftlichen Publikationen pro Jahr 
mehr als verdoppelt, vgl. [https://www.hceres.fr/sites/default/files/media/downloads/rappScien_VA_ 
web04_12.pdf] (Zugriff: 19.10.2023); im Heft „Publikationsregime“ der Zeitschrift Mittelweg 36 findet 
sich eine eindrückliche grafische Darstellung dieser bedenklichen Entwicklung (siehe Heft 2, 2022, 
47). 


8 Open Access. © 2024 bei den Autorinnen und Autoren, publiziert von De Gruyter. Dieses Werk ist 


lizenziert unter einer Creative Commons Namensnennung - Nicht kommerziell - Keine Bearbeitung 4.0 International 
Lizenz. https:/doi.org/10.1515/9783111351490-012 
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sichtlich, worauf die Tools zurückgreifen und ob sich darunter auch Fremdtexte 
befinden, an denen Autor_innen Rechte haben. 

Fragen der Textidentität, des Verhältnisses von Text und Werk, der Autor_in- 
nenschaft” und der Schöpfungshöhe® sind selbstverständlich nicht neu - dazu gibt 
es bereits eine Reihe bedenkenswerter wissenschaftlicher Überlegungen, etwa in 
der Kunstphilosophie. Einige davon sollen im Folgenden aufgegriffen und dahin- 
gehend geprüft werden, ob sie sich für den Umgang mit wissenschaftlichen Texten 
fruchtbar machen lassen, bei deren Entstehung KI-Tools zum Einsatz gekommen 
sind. Dabei wird sich auch zeigen, dass die Nutzung von KI-Tools bei der wissen- 
schaftlichen Texterzeugung noch sehr viel grundsätzlichere Fragen aufwirft: die 
Fragen nämlich, wie wir Wissenschaft verstehen und was die Arbeit von Wissen- 
schaftler_innen im Kern ausmacht. 


1 Texte generieren, Debatten revolutionieren?! 
Ein Gedankenexperiment zum Einsatz 
textgenerativer KI-Tools in der Wissenschaft 
und drei kunstphilosophisch inspirierte 
Perspektiven darauf 


Wenn wir die Texterzeugnisse, die beim Einsatz von KI-Tools entstehen, grob un- 
terteilen wollen, können wir zunächst Texte und Textteile, die es bereits gibt, von 
solchen Texten und Textteilen unterscheiden, die es noch nicht gibt. Wie wir sehen 
werden, bedarf allerdings auch die Kategorie der Texte bzw. Textteile, die es schon 
gibt, einer weiteren Differenzierung: Das darin Enthaltene mag sich vordergründig 
ähneln - tatsächlich aber gibt es einige ontologische Unterschiede, die es beim 
Umgang damit zu beachten gilt. Mittels eines Gedankenexperiments, das ich im 
Folgenden entwickeln möchte, lassen sich diese Unterschiede genauer fassen. Im 
Mittelpunkt des Experiments steht ein Aufsatz des Philosophen Edmund Gettier. 
Gettier war zu einer Zeit in der Wissenschaft tätig, zu der Wissenschaftler innen 


2 Unbedingt lesenswert zu diesen und verwandten Fragen ist (nicht zuletzt aufgrund der um- 
fangreichen Fußnoten, die einen Überblick über zahlreiche einschlägige Publikationen geben) 
Carlos Spoerhase, „Was ist ein Werk? Über philologische Werkfunktionen“, Scientia Poetica. Jahr- 
buch fur Geschichte der Literatur und der Wissenschaften, Bd. 11, 2007, 276-344. 

3 Zum urheberrechtlichen Begriff der Schöpfungshöhe und seiner Explikation unter Rückgriff auf 
die Eigenschaften der Individualität und Eigentümlichkeit vgl. Gunda Dreyer/Jost Kotthoff/Astrid 
Meckel, Urheberrecht, § 2 Rn. 58ff., München/Heidelberg 2004. 
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noch nicht zu derart ausgreifender Publikationstätigkeit aufgerufen waren wie in 
Zeiten der Wirksamkeit des fragwürdigen Prinzips publish or perish. Dennoch ging 
es auch damals schon nicht ganz ohne Publizieren, wobei sich Gettiers Publikati- 
onstätigkeit auf zwei Aufsätze und eine Rezension belief. Nichtsdestotrotz hat 
Gettier in der Philosophie eine enorme Bekanntheit erlangt, denn mit einem seiner 
Aufsätze, dem dreiseitigen Essay „Is Justified True Belief Knowledge?“*, hat er nicht 
weniger getan als die philosophische Debatte um den Wissensbegriff zu revolu- 
tionieren: Die berühmten Gettier-Fälle stellen in Frage, dass sich Wissen tatsächlich 
als wahre, gerechtfertigte Überzeugung auffassen lässt - eine Auffassung, die bis 
dato als ausgemacht galt. Nun stellt die Geschichte von Gettiers Aufsatz offen- 
sichtlich den Hype der Quantität in Frage, wie er gegenwärtig im Wissenschafts- 
system vorherrscht - aber darum soll es hier nicht gehen. Auch die Debatte um den 
Wissensbegriff als solche möchte ich hier nicht aufgreifen. Stattdessen steht Get- 
tiers hinsichtlich seiner Seitenzahl sehr überschaubarer, deshalb aber keineswegs 
weniger einflussreicher Aufsatz im Mittelpunkt des Gedankenexperiments, das ich 
hier anstellen möchte. 

Stellen wir uns vor, dass wir einen KI-Textgenerator dazu einsetzen, einen 
philosophischen Aufsatz zu generieren, der es vermocht hätte, die damalige phi- 
losophische Debatte um den Wissensbegriff auf den Kopf zu stellen - und nehmen 
wir weiterhin an, dass der Textgenerator dabei einen Text erzeugt, der Buchstabe 
für Buchstabe mit dem Aufsatz von Gettier übereinstimmt. Wir haben es hier also in 
jedem Fall mit einem Ergebnis zu tun, das in die erste Kategorie der Texterzeugnisse 
gehört — die Kategorie der Texte bzw. Textteile, die es schon gibt. Wenn wir uns 
fragen, wie genau dieses Ergebnis zustande gekommen ist, zeigt sich allerdings, 
warum wir innerhalb dieser Kategorie eine weitere Differenzierung vornehmen 
sollten. Zwei Arten der Entstehung wären zu unterscheiden (wobei sie eher Ex- 
treme auf einer Skala darstellen, die auch Mischformen beider Arten enthält). 

Zunächst einmal können wir uns vorstellen, dass der KI-Generator als reine 
Kopiermaschine dient und tatsächlich schlicht eine Kopie des Aufsatzes von Gettier 
produziert, indem er Buchstabe für Buchstabe dieses Aufsatzes übernimmt. In 
diesem Fall verdankt sich die Übereinstimmung mit Gettiers Aufsatz einem Ko- 
pierprozess, der den Aufsatz zum Ausgangspunkt nimmt - nennen wir das Ergebnis 
KI-Text 1. 

Aber das ist nicht die einzig mögliche Art der Entstehung eines Textes, der dem 
von Gettier exakt gleicht: KI-Tools erzeugen mitunter auch Inhalte, die keine direkte 
Entsprechung zu etwas bereits Vorhandenem haben, indem sie halluzinieren. 
Dieses Halluzinieren wird im wissenschaftlichen Verwendungskontext u.a. deshalb 


4 Edmund Gettier, „Is Justified True Belief Knowledge?“, Analysis, Bd. 23(6), 1963, 121-123. 
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problematisiert, weil dabei mitunter erstaunlich elaborierte Beschreibungen gar 
nicht existierender (wissenschaftlicher) Werke einschließlich ihrer (Entstehungs-) 
Kontexte herauskommen, deren Existenz von den Tools gleichwohl mit beachtli- 
chem Selbstbewusstsein behauptet wird. Ein Phänomen, das wissenschaftlichen 
Recherchetätigkeiten offenkundig nicht gerade zuträglich ist. In diesem Fall wollen 
wir uns vorstellen, dass das Ergebnis des Halluzinierens ein Text ist, der allein 
aufgrund seiner Buchstabenfolge von Gettiers Aufsatz nicht zu unterscheiden ist — 
obwohl es sich bei diesem Text gerade nicht um eine Kopie handelt. 

Wer bezweifelt, dass ein solches Szenario denkbar ist, sei an das Infinite 
Monkey Theorem erinnert, ein weiteres Gedankenexperiment, das besagt, dass 
Affen, die unendlich lange auf Schreibmaschinen tippen, irgendwann einmal durch 
bloßen Zufall alle Werke der Weltliteratur hervorgebracht haben werden. Analog 
dazu können wir uns das Theorem der endlos generierenden KI vorstellen, das statt 
von unendlich lang tippenden Affen von unendlich lang Texte generierenden KI- 
Tools ausgeht. Irgendwann, so die Idee, käme dabei durch bloßen Zufall etwas 
heraus, das alle und nur die Buchstaben aufweist, die auch Gettiers Aufsatz hat — 
und das sogar in derselben Reihenfolge. Nennen wir das Ergebnis dieses Vorgangs 
KI-Text 2. 

Wenn es allein um die Buchstabenfolge geht, sind der durch Kopieren erzeugte 
KI-Text 1 und der durch Halluzinieren zustande gekommene KI-Text 2 nicht von- 
einander zu unterscheiden. Auf ontologischer Ebene hingegen sieht das mögli- 
cherweise anders aus: Da mögen die verschiedenen Arten der Entstehung sehr wohl 
einen Unterschied machen - einen Unterschied, der sich auch auf unseren Umgang 
mit diesen Texten auswirken könnte, ja, vielleicht sogar sollte. Aber der Reihe nach: 
Zunächst stellt sich die Frage, wie die beiden Texte ontologisch eingeordnet werden 
können. Handelt es sich dabei schlicht und ergreifend um (Realisierungen von) 
Gettiers Aufsatz? Oder sind die Texte von Gettiers Aufsatz verschieden? Falls letz- 
teres der Fall sein sollte: Wer ist Autor_in der Texte, wenn es nicht Gettier ist? Und: 
Können wir den Texten eine Schöpfungshöhe zuschreiben, die für ihren Status als 
urheberrechtlich schutzfähige Hervorbringungen ausschlaggebend ist? Wie wir 
diese Fragen beantworten, wirkt sich auch darauf aus, wie wir mit den Texten 
umgehen - insbesondere im Hinblick auf die Plagiatsthematik. Denn die Eigen- 
schaft des Plagiat-Seins ist eine zweistellige Relation: Etwas - ein y - ist ein Plagiat 
von etwas anderem - einem x.° Damit sich überhaupt überzeugend von einem 


5 Für eine ausführliche Definition dieser Relation vgl. Amrei Bahr, Was ist eine Kopie?, Hamburg 
2022, 339 ff. 
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Plagiat sprechen lässt, muss dieses x zudem die Eigenschaft der Schöpfungshöhe 
aufweisen — und seine Existenz einer einem Autor _in verdanken.‘ 

Um die Fragen nach Textidentität, Autor_innenschaft und Schöpfungshöhe im 
Hinblick auf unsere beiden KI-generierten Texte zu beantworten, lohnt sich ein 
Blick in die Kunstphilosophie, in der sich diverse auf künstlerische Texte bezogene 
Ansätze finden, die auch für den wissenschaftlichen Kontext aufschlussreich sein 
könnten. Drei Ansätze sollen dahingehend geprüft werden, ob sie sich auch für 
wissenschaftliche Texte fruchtbar machen lassen: die Ansätze von Nelson Good- 
man, Arthur Danto und Jerrold Levinson. 


1.1 Goodman: Textidentität garantiert Werkidentität 


Nelson Goodman diskutiert das Verhältnis von Textidentität und Werkidentität im 
Kontext seiner Überlegungen zu autographischen und allographischen Kunstfor- 
men im dritten Kapitel von Sprachen der Kunst.’ Allographische Kunstwerke, zu 
denen auch Textwerke zählen, zeichnen sich nach Goodmans Auffassung dadurch 
aus, dass sie — anders als autographische Kunstwerke wie Gemälde - nicht falschbar 
sind: Sobald alle Buchstaben eines Textwerks in der richtigen Reihenfolge vorliegen, 
haben wir es einfach automatisch mit diesem Textwerk zu tun, nicht etwa mit einer 
Fälschung. Tippe ich etwa den Roman Zeiten der Langeweile von Jenifer Becker? 
Buchstabe für Buchstabe ab, dann ist das Resultat keine Fälschung des Romans, 
sondern einfach der Roman selbst (bzw. eine Realisierung desselben)”: „Jede genaue 
Kopie eines Gedicht- oder eines Romantextes ist genausogut das Originalwerk wie 
irgendeine andere.“’° Es ist die notationale Identität, die aus Goodmans Sicht 
Textidentität garantiert: 


Es zählt allein das, was man die Selbigkeit des Buchstabierens nennen könnte: exakte Ent- 
sprechung in den Buchstabenfolgen, Abständen und Satzzeichen. Jede Folge [...], die einer 


6 Nicht alles, was Autor_innen hervorbringen, hat automatisch Schöpfungshöhe - einzelne Sätze 
oder Satzteile sind häufig nicht ausreichend elaboriert, um ihnen Schöpfungshöhe zuzuschreiben. 
Ob jedoch alles, was Schöpfungshöhe hat, auch ein_e Autor_in hat, ist eine Frage, die uns im Fol- 
genden noch beschäftigen wird. 

7 Nelson Goodman, Sprachen der Kunst. Entwurf einer Symboltheorie, Frankfurt a.M. 1995. 

8 Jenifer Becker, Zeiten der Langeweile, Berlin 2023. 

9 Da Goodman selbst Nominalist ist und deshalb auch nicht von abstrakten Werken ausgeht, die 
durch Bücher aus Papier o.ä. realisiert werden, vermeidet er diese Redeweise, wobei fraglich ist, ob 
er für seine Theorie nicht eigentlich ein solches Verhältnis von abstrakten Werken zu konkreten 
Realisierungen voraussetzen müsste. 

10 Goodman 1995, 114. 
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korrekten Kopie in dieser Weise entspricht, ist selbst korrekt, und ein solch korrektes Exem- 
plar ist genauso Original wie das Original selbst. [...] Um einen Einzelfall des Werks zu iden- 
tifizieren beziehungsweise einen Einzelfall herzustellen, ist nichts weiter erforderlich, als die 
Buchstabierung zu verifizieren beziehungsweise korrekt zu buchstabieren.'' 


Wie lässt sich diese Auffassung nun in unserem Kontext anwenden? Jeder Text, der 
mit dem Aufsatz von Gettier notational identisch ist, ist ihr zufolge ein Exemplar 
dieses Textes - und zwar unabhängig davon, wie der Text zustande gekommen ist: 
Es geht allein um die korrekte Anordnung der Buchstaben. Demzufolge sind sowohl 
der durch Kopieren entstandene KI-Text 1 als auch der durch Halluzinieren her- 
vorgebrachte KI-Text 2 Realisierungen von Gettiers Aufsatz. 

Dass Gettier weder dem Hervorbringen von K/-Text 1 noch dem von KI-Text 2 
zugestimmt hat, ist für sich genommen noch kein überzeugendes Argument, um 
Goodmans Theorie für unseren Kontext zu verwerfen. Denn Realisierungen können 
auch nicht-autorisiert sein: Das, was landläufig unter dem Namen „Raubkopie“ 
bekannt ist (und neutraler als Schwarzkopie bezeichnet wird"), ist ein Beispiel 
dafür. Tippe ich Jenifer Beckers Roman ab und verkaufe die Ausdrucke im Internet, 
dann mag es sich sehr wohl um Realisierungen des Romans handeln - aber ich 
verletzte damit Rechte des Verlags und der Autorin, wenn sie mir die Anfertigung 
nicht erlaubt haben. Das gilt in der Kunst und der Wissenschaft gleichermaßen. 

Aber es gibt noch ein anderes Argument, das die Anwendbarkeit von Goodmans 
Theorie auf wissenschaftliche Texte in Frage stellt: Folgen wir Goodmans Auffas- 
sung, dann müssen auch Texte, die durch bloßen Zufall entstehen, Autor_innen 
zugeordnet werden, wenn es Hervorbringungen dieser Autor_innen gibt, die den 
Texten notational entsprechen. Auch der halluzinierte KI-Text 2 wäre demzufolge 
ein Exemplar von Gettiers Aufsatz, ohne dass es zwischen ihm und dem Aufsatz 
irgendeinen Kausalzusammenhang gibt. Das dürfte den verbreiteten Vorstellungen 
von wissenschaftlicher Autor_innenschaft widersprechen: Texte brauchen eine 
Beziehung zu Autor_innen, um Exemplare ihrer Werke zu sein. 

Wir können uns das Erfordernis einer entsprechenden Beziehung an einem 
weniger elaborierten Beispiel vor Augen führen, nämlich dem Selbstwider- 
spruchsargument gegen den Relativismus:'” Wenn alles lediglich relativ gültig ist 
und nicht absolut, muss das auch für den Relativismus selbst gelten - ohne Abso- 


11 Ebd., 115. 

12 Eine ausgiebige Würdigung dieser Kopienart findet sich in Jan Krömer/Evrim Sem, No Copy Die 
Welt der digitalen Raubkopie, Berlin 2006. 

13 Vgl. Maria Baghramian/]. Adam Carter, „Relativism“, in The Stanford Encyclopedia of Philosophy, 
hg. von Edward N. Zalta, Spring Edition, 2022, Abschnitt 4.31, in [https://plato.stanford.edu/archives/ 
spr2022/entries/relativism/] (Zugriff: 19.10.2023). 
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lutheitsanspruch seiner Kernprämisse gerät er damit selbst ins Wanken. Es liegt 
nahe, dass auf diese Argumentationsfigur mehrere Menschen kommen, ohne je- 
weils voneinander zu wissen. Wir können uns vorstellen, dass zwei Philosoph_in- 
nen A und B sogar dieselben Worte benutzen, um das Selbstwiderspruchsargument 
niederzuschreiben. Wer ist nun Autor_in des entsprechenden Textes? Ist Philo- 
soph_in A automatisch auch Autor_in des Textes von Philosoph_in B, weil A früher 
darauf gekommen ist? Mir scheint, dass beide hier die Anerkennung ihrer Au- 
tor_innenschaft verdienen: Sie haben Texte hervorgebracht, die notational iden- 
tisch sind, aber zwei unterschiedliche Werke realisieren - im Urheberrecht spricht 
man in diesem Fall von einer Doppelschöpfung. Es ließe sich natürlich fragen, ob 
die wissenschaftliche Redlichkeit es an Bs Stelle geboten hätte, so umfassend zu 
recherchieren, bis sie_er den Beitrag von A findet. Aber angesichts der Flut an 
Publikationen, die wir in vielen Feldern vorfinden, muss der Anforderung, sich mit 
einer Debatte ausreichend vertraut zu machen, eine angemessene pragmatische 
Grenze gesetzt sein; andernfalls würde nie ein wissenschaftlicher Text fertig — es 
gäbe schließlich immer noch Möglichkeiten, weiter zu recherchieren. Ist das Er- 
fordernis einer angemessenen Recherche durch B erfüllt, erscheint es naheliegend, 
B als Autor_in ihres_seines Textes aufzufassen, da der Text vollkommen unabhängig 
vom durch A verfassten Text zustande gekommen ist. Es würde im Kontext wis- 
senschaftlicher Texte einige Verwirrung stiften, wenn wir allein aufgrund einer 
Übereinstimmung die unabhängige Leistung von B auch A zuschreiben müssten — 
das allein schon deshalb, weil A und B ganz unterschiedliche wissenschaftliche 
Bezugspunkte haben mögen, auf deren Grundlage sie ihre jeweilige Argumentation 
entwickelt haben. Diese Bezugspunkte lassen sich offenkundig nicht einfach be- 
liebig dem Text der jeweils anderen Person zuschreiben. Insofern kann Goodmans 
Auffassung, dass notationale Übereinstimmung Textidentität garantiert, für unse- 
ren Kontext nicht überzeugend. 


1.2 Danto: Textidentität erzwingt keine Werkidentität - nicht 
einmal beim Kopieren 


Arthur Danto befasst sich in Die Verklärung des Gewöhnlichen mit allen möglichen 
Gegenständen, die ununterscheidbar zu sein scheinen, um auf diesem Wege den 
Besonderheiten der Kunst auf die Spur zu kommen. Seine Auffassung zu Texten 
steht dabei im Vergleich zu Goodmans Auffassung gewissermaßen am gegenüber- 
liegenden Ende des Spektrums: Laut Danto ist notationale Übereinstimmung mit- 
nichten hinreichend dafür, dass wir es mit demselben Werk zu tun haben - und das 
nicht einmal dann, wenn die notationale Übereinstimmung das Ergebnis eines 
Kopierprozesses ist. Den Ausgangspunkt für Dantos Überlegungen bildet die Er- 
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zählung „Pierre Menard, Autor des Quijote“ von Jorge Luis Borges, in der der fiktive 
französische Autor Pierre Menard versucht, einzelne Kapitel des Don Quijote von 
Miguel de Cervantes neu zu schreiben.'* Was er dabei an Text produziert, stimmt 
Buchstabe für Buchstabe mit den jeweiligen Kapiteln des Don Quijote von Cervantes 
überein. Danto zufolge ist das Ergebnis dieser Kopierhandlung vonseiten Menards 
aber keine Realisierung des Don Quijote von Cervantes. Vielmehr hat Menard nach 
Dantos Auffassung ein gänzlich neues Werk hervorgebracht - ungeachtet der 
Übereinstimmung seines Textes mit dem von Cervantes: 


Zwei Exemplare von Cervantes’ Werk sind Exemplare desselben Werks, ebenso wie zwei Ex- 
emplare von Menards Werk; doch ein Exemplar von Cervantes’ Werk und ein Exemplar von 
Menards Werk sind Exemplare von verschiedenen Werken, obwohl sie sich ebensosehr glei- 
chen, wie Paare von Exemplaren desselben Werks." 


Ein Text, der mit dem Aufsatz von Gettier notational identisch ist, kann demzufolge 
sogar dann ein Exemplar eines anderen Werkes sein, wenn der Text durch Kopieren 
zustande gekommen ist. Für unsere beiden Beispieltexte heißt das, dass sowohl der 
halluzinierte KI-Text 2 als auch der kopierte KI-Text 1 allen Ubereinstimmungen mit 
Gettiers Aufsatz zum Trotz unabhängige Werke konstituieren können. Im Hinblick 
auf wissenschaftliche Texte erscheint diese Auffassung allerdings wenig plausibel: 
Egal, ob ich den Text von Gettier manuell abtippe oder eine wie auch immer geartete 
Kopiermaschine zum Einsatz bringe - und sei es eine, die mit KI operiert: Es wird 
nicht gelingen, den Aufsatz von Gettier ‚neu zu schreiben‘. Das liegt vor allem daran, 
dass zum wissenschaftlichen Gehalt der Ausführungen im Zuge des Kopiervorgangs 
nichts Neues hinzutritt. Das ist Danto zufolge bei seinem Beispiel anders, der lite- 
rarische Gehalt der beiden in Rede stehenden Texte unterscheidet sich demnach 
sehr wohl: Der Text von Menard sei etwa viel subtiler als der von Cervantes, der 
Text von Cervantes hingegen sei plump; beide Werke wiesen unterschiedliche Stile 
auf.’® 

Allein der Umstand, dass beide Texte zu verschiedenen Zeiten von zwei un- 
terschiedlichen Autoren geschrieben wurden, macht fiir Danto einen Unterschied.?” 
Zwar sieht auch er die kausale Verbindung zwischen den Texten; bei Menards Text 
handelt es sich seiner Auffassung nach aber um mehr als eine Kopie des Werks von 


14 Jorge Luis Borges, „Pierre Menard, Autor des Quijote“, in ders., Blaue Tiger und andere Ge- 
schichten, hg. von Gisbert Haefs, München/Wien 1988, 43-54. 

15 Arthor C. Danto, Die Verklärung des Gewöhnlichen. Eine Philosophie der Kunst, Frankfurt a.M. 
1984, 65. 

16 Vgl. ebd., 65. 

17 Vgl. ebd., 66. 
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Cervantes: Eine Kopie sei eine Verdoppelung ohne literarische Leistung - und 
Menard habe eine literarische Leistung vollbracht.'” Dasselbe lässt sich für den 
wissenschaftlichen Kontext nicht behaupten; wer bestehende Texte wissentlich 
reproduziert, ohne etwas Neues hinzuzufügen, erbringt keine eigene wissen- 
schaftliche Leistung, die es rechtfertigen würde, dies durch die Zuschreibung von 
Autor_innenschaft anzuerkennen. Im Lichte der Beispiele zeigt sich also, dass auch 
Dantos Auffassung im Hinblick auf wissenschaftliche Texte nicht zu überzeugen 
vermag. 


1.3 Levinson: Textidentität erzeugt Werkidentität allein via 
Kausalität 


Stehen Goodman und Danto mit ihren Auffassungen jeweils an den beiden äußeren 
Enden des Spektrums der Auffassungen zu Text- und Werkidentität, so nimmt die 
Auffassung von Jerrold Levinson eine Mittelposition ein.'” Levinson reagiert damit 
auf die Theorie von Goodman - dabei sucht er der Intuition Rechnung zu tragen, 
dass sich ein Text nicht als Realisierung eines Werks verstehen lässt, wenn er zu 
diesem Werk keinerlei Beziehung aufweist: Textidentität reicht laut Levinson nicht 
aus, damit ein Text eine Realisierung eines Werks ist — mit einer Realisierung haben 
wir es erst zu tun, wenn eine kausale Verbindung zum in Rede stehenden Werk 
besteht. Denn Textwerke sind mehr als bloß Wörter in einer bestimmten Reihen- 
folge, wie Levinson anhand des Beispiels eines Gedichts ausführt: 


[A] poem is certainly not just a given word sequence. A poem is the product of a particular 
individual at a specific time and place, with a reasonably definite meaning and aesthetic 
character which is in part a function of that time and place. A word sequence per se, on the 
other hand, existing as long as the relevant language has existed, cannot be the creation of a 
given person and possesses neither the sort of meaning nor the aesthetic character which a 
poem bears in its context.” 


Texte werden demzufolge erst dann zu Hervorbringungen von Autor_innen, wenn 
sie in Werke eingebettet sind. In Bezug auf unsere beiden Beispiele, den durch 
Kopieren erzeugten KI-Text 1 und den halluzinierten KI-Text 2, hieße das: KI-Text 1 ist 
durchaus eine Realisierung von Gettiers Aufsatz, geht er doch direkt auf diesen 
Aufsatz zurück. Anders verhält es sich jedoch mit KI-Text 2, bei dessen Entstehung 


18 Vgl. ebd., 67. 

19 Vgl. Jerrold Levinson, „Autographic and Allographic Art Revisited“, Philosophical Studies, 
Bd. 38(4), 1980, 367-383. 

20 Vgl. ebd., 373. 
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Gettiers Aufsatz keine Rolle gespielt hat: Dieser Text stellt keine Realisierung dar. 
Damit wird zugleich deutlich, warum K/-Text 2 von besonderem Interesse ist: Gehen 
wir davon aus, dass das KI-Tool, das den Text erzeugt hat, selbst kein_e Autor_in sein 
kann, so hätten wir es hier mit einem Text zu tun, der kein_e Autor _in hat, was 
diverse Folgefragen hinsichtlich Urheberrechten, der Schutzfähigkeit derartiger 
Texte, ihrer möglichen Schöpfungshöhe usw. aufwirft - dazu gleich mehr. Zunächst 
aber können wir festhalten, dass Levinsons Auffassung den verbreiteten Vorstel- 
lungen von wissenschaftlicher Autor_innenschaft eher entspricht als die Auffas- 
sungen von Goodman und Danto: Kopierte Texte sind Realisierungen wissen- 
schaftlicher Werke. Es mag ihnen an einer Autorisierung mangeln, aber das ändert 
nichts an ihrem Status als Realisierungen. Ohne Beziehung zu Autor_innen hinge- 
gen entsteht keine Realisierung von deren Werken; ist die Übereinstimmung der 
Buchstabenfolge bloßer Zufall und kommt ohne Beziehung zum Werk zustande, 
haben wir es auch nicht mit einer Realisierung desselben zu tun. 


2 Kopiert oder halluziniert? Was das für unseren 
Umgang mit (teils) KI-generierten 
wissenschaftlichen Texten bedeutet 


Nun ist oben bereits zur Sprache gekommen, dass die beiden Beispiele - der durch 
reines Kopieren erzeugte KI-Text 1 und der allein durch Halluzinieren hervorge- 
brachte KI-Text 2 - ihrerseits Extremfälle darstellen. Wahrscheinlicher ist es, dass 
KI-Tools Mischformen generieren, die kopierte und halluzinierte Elemente mit- 
einander verbinden. Bleiben wir aber noch einen Moment bei den fiktiven Ex- 
tremfällen stehen. Denn sie können uns Aufschluss geben darüber, warum und 
inwiefern unser Umgang mit kopierten Textelementen in der Wissenschaft ein 
anderer sein sollte als der mit halluzinierten Textelementen. Folgen wir der skiz- 
zierten Auffassung von Levinson, die sich für den wissenschaftlichen Kontext als 
fruchtbar erwiesen hat, dann erzeugt die vorliegende Textidentität im Falle unserer 
Kopie, des KI-Textes 1, auch Werkidentität: KI-Text 1 ist eine Realisierung von Get- 
tiers Aufsatz, denn er geht direkt auf diesen Aufsatz zurück. Entsprechend einfach 
ist die Frage nach der Autor_innenschaft zu beantworten: Der Autor ist Gettier. 

Nun mag man argumentieren, dass es nicht plausibel erscheint, Gettier als 
Autor des KI-generierten KI-Text 1 zu bezeichnen. Schließlich hatte Gettier mit der 
Entstehung dieses Textes — dem Generieren der einzelnen Buchstaben mittels KI - 
gar nichts zu tun. Darauf lassen sich allerdings zwei Dinge erwidern: Zum einen ist 
für den Realisierungsstatus einer Kopie unerheblich, ob sie etwa durch das Gene- 
rieren einzelner Buchstaben entsprechend ihrer Vorlage zustande kommt oder 
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aber durch das Kopieren einzelner Textseiten mit einem handelsüblichen Kopierer. 
Zum anderen ist eine zentrale Einsicht der Überlegungen von Levinson gerade, dass 
Texte erst dann zu Werken werden, wenn sie auf die Anstrengungen von Au- 
tor_innen zurückgehen. In diesem Fall sind das klarerweise die Anstrengungen 
Gettiers, und KI-Text 1 ist somit eine Realisierung von Gettiers Aufsatz. Auch die 
damit verknüpfte Frage nach der Schöpfungshöhe dürfte sich in Bezug auf KI-Text 1 
leicht beantworten lassen: Sie ist ebenfalls gegeben. Denn es lässt sich kaum be- 
streiten, dass Gettiers Aufsatz über Schöpfungshöhe verfügt, und daran hat ent- 
sprechend auch KI-Text 1 als dessen Realisierung teil. 

Anders sieht es mit dem durch Halluzinieren erzeugten KI-Text 2 aus. Folgen wir 
der Auffassung Levinsons, so fehlt diesem Text die entscheidende Verbindung zu 
Gettiers Aufsatz, sodass es sich bei ihm nicht um eine Realisierung von Gettiers 
Aufsatz handelt. Interessant wird es nun aber, wenn wir uns den Fragen nach 
Schöpfungshöhe und der Autor_innenschaft zuwenden. Obwohl KI-Text 2 ein Pro- 
dukt des Zufalls ist, scheint es naheliegend, die Frage nach dem Vorliegen von 
Schöpfungshöhe ebenfalls bejahend zu beantworten. Dafür ließe sich das folgende 
kontrafaktische Argument heranziehen: K/-Text 1 hat Schöpfungshöhe, was sich 
seiner Buchstabenfolge und deren wissenschaftlichem Gehalt verdanken dürfte. KI- 
Text 2 gleicht KI-Text 1 nun Buchstabe für Buchstabe. Ich kann bei der Lektüre 
beider Texte dieselben wissenschaftlichen Einsichten gewinnen. Beide Texte er- 
möglichen mir ein Verständnis der darin enthaltenen wissenschaftlichen Argu- 
mente. Wenn also KI-Text 1 über Schöpfungshöhe verfügt und KI-Text 2 diesem Text 
in den dafür relevanten Hinsichten gleicht, so können wir davon ausgehen, dass KI- 
Text 2 ebenfalls über Schöpfungshöhe verfügt. Die Argumentation allein, dass KI- 
Text 2 als Ergebnis halluzinierender KI prinzipiell keine Schöpfungshöhe zuge- 
schrieben werden kann, wäre eine Ad-hoc-Argumentation, die als solche wenig 
Überzeugungskraft hat. 

Wenn aber KI-Text 2 nun tatsächlich über Schöpfungshöhe verfügt und damit 
zugleich rechtlich schutzfähig ist, wer profitiert dann von dieser Schutzfähigkeit? 
Diese Frage zu beantworten gestaltet sich schwierig angesichts der Tatsache, dass 
unklar ist, wer — wenn überhaupt jemand - als Autor_in von KI-Text 2 in Frage 
kommt. Solange wir ausschließen wollen, dass KI selbst Autor_in sein kann - und 
das erscheint jedenfalls zum aktuellen Zeitpunkt noch plausibel”' -, kommen al- 
lenfalls die Personen in Frage, die die KI genutzt oder programmiert haben. Nun ist 
zumindest bei den in Rede stehenden KI-Textgeneratoren fraglich, ob deren Pro- 


21 Vgl. Till Kreutzer, „Welche Regeln gelten für die Erzeugnisse Künstlicher Intelligenz?“, 
irights.info, 2022, in [https:/irights.info/artikel/welche-regeln-gelten-fuer-die-erzeugnisse-kuenstli 
cher-intelligenz/30724] (Zugriff: 19.10.2023). 
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grammierung als solche hinreichend sein kann, um Autor_innenstatus zu begrün- 
den. Schließlich handelt es sich dabei um Tools, die zwar Möglichkeiten und Rah- 
menbedingungen der Texterzeugung bieten, aber damit selbst nur einen geringen 
Anteil am Ergebnis dieser Texterzeugung haben. Auch die Programmierer_ innen 
der Textverarbeitungs-Software, mit der ich gerade diesen Beitrag schreibe, lassen 
sich sicherlich nicht plausibel als Mitautor_innen des Beitrags auffassen; analog 
dürfte es sich mit KI-Generatoren verhalten. 

Bleiben die Nutzer_innen, also diejenigen, die die Prompts in die Textgenera- 
toren eintragen und eine Auswahl aus verschiedenen damit erzeugten Texten 
treffen. Das führt uns nicht nur zu der Frage, ob wissenschaftliche Autor_innen- 
schaft zukünftig auch durch elaboriertes Prompts-Schreiben und Kuratieren KI- 
generierter Texte erreicht werden kann: Reicht die Verbindung zu den Hervor- 
bringungen, die dabei entsteht, aus, um hier von Autor_innenschaft auszugehen? 
Das Argument, dass klassische wissenschaftliche Autor_innen mehr Kontrolle über 
ihre Texte und deren Ausgestaltung ausüben, verkennt vermutlich ein Stückweit 
das Eigenleben und die Widerständigkeit, die Texte bisweilen entwickeln, sowie die 
Kontingenz von Schreibprozessen. Von vornherein verwerfen lässt sich die Mög- 
lichkeit wissenschaftlicher Autor_innenschaft durch das Prompts-Schreiben und 
Kuratieren von damit erzeugten Inhalten so nicht. Es ist an der wissenschaftlichen 
Community, im gemeinsamen Austausch überzeugende Formen des Umgangs mit 
derartigen Fragen zu finden, und das nicht nur bei Texten, die — wie unser Beispiel, 
der KI-Text 1 - bereits eine publizierte Entsprechung aus der Feder wissenschaft- 
licher Autor_innen haben. Ohne Frage liegt es vor allem bei solchen Texten nahe, 
unmittelbar an die Plagiatsthematik zu denken - schließlich gehen sie direkt auf die 
Arbeit Dritter zurück. Die Plagiatsthematik ist aber durchaus auch bei halluzi- 
nierten Texten relevant. Denn ohne Kenntnis der Umstände ihrer Entstehung sind 
Kl-erzeugte Textkopien nicht von durch halluzinierende KI erzeugten Texten un- 
terscheidbar. Die wissenschaftliche Redlichkeit gebietet es ohnehin, (in einem ge- 
wissen Umfang) zu prüfen, ob eigene Texte Parallelen zu bereits vorliegenden 
Texten aufweisen. Insofern wäre eine entsprechende Überprüfung im Sinne der 
Einhaltung der Standards guter wissenschaftlicher Praxis eine Mindestanforderung 
der Nutzung KI-generierter Texte und Textteile - und das unabhängig davon, ob die 
bestehenden Ähnlichkeiten zu anderen Texten durch Kopierprozesse oder bloßen 
Zufall entstanden sind. Das gilt nicht zuletzt, da sich die Genese der Ähnlichkeiten 
für Nutzer_innen je nach Funktionsweise der eingesetzten KI-Tools nur begrenzt 
oder gar nicht wird nachvollziehen lassen. 

Gleichwohl ist damit eine wichtige Frage noch gar nicht beantwortet — und 
diese rührt an unserem Grundverständnis von Wissenschaft und wissenschaftli- 
chem Arbeiten. Diese Frage wird gerade nicht von den Texterzeugnissen generati- 
ver KI aufgeworfen, die eine Entsprechung in Form bereits bestehender wissen- 
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schaftlicher Texte haben, sondern von Texterzeugnissen, die tatsächlich ihrerseits 
originell sind - und damit zugleich über Schöpfungshöhe verfügen. Wenn wir davon 
ausgehen, dass wissenschaftliche Theorien und Argumente für sich stehen und auch 
unabhängig davon, wer ihre Autor_innen sind, einen Wert haben - und das er- 
scheint durchaus sinnvoll —, dann müssen wir uns fragen, wie wir mit durch KI- 
Tools halluzinierten Texten umgehen wollen, die bedenkenswerte neue wissen- 
schaftliche Theorien und Argumente enthalten. Es mag am Selbstverständnis 
ebenso wie am Selbstbewusstsein von Wissenschaftler innen kratzen, zu akzep- 
tieren, dass KI-Tools so wie sie selbst zu Teilnehmer_innen am wissenschaftlichen 
Diskurs werden könnten. Fraglos darf das nicht ohne menschliche Kontrolle ge- 
schehen, denn wir wissen, dass der Einsatz von KI-Tools einige Risiken birgt, was 
etwa die Reproduktion von Vorurteilen und Diskriminierung betrifft. Gehen wir 
allerdings davon aus, dass allein die Güte von Theorien und Argumenten zählt (und 
damit ist die Güte im moralischen Sinne eingeschlossen, also etwa die Abwesenheit 
von Vorurteilen), dann ist zunächst einmal nicht ersichtlich, warum wissenschaft- 
liche Einsichten, die halluzinierende KI gewinnt, nicht auch Eingang in wissen- 
schaftliche Debatten finden sollte. Wir als Wissenschaftscommunity sollten diese 
Möglichkeit jedenfalls ebenso ernst nehmen und kritisch prüfen wie die Möglich- 
keit der (Ko-)Autor_innenschaft durch KI-Textgeneratoren. 


Andie Rothenhäusler 


„Creating God“ 


Religiöse Metaphorik in KI- und Technikdiskursen 


Abstract: Since the launch of ChatGPT, religious rhetoric and metaphors have been 
part of the AI discourse. Fears of an „AI apocalypse“ have made this phenomenon 
even more pronounced. In my paper, I consider four possible interpretations for the 
supposedly anachronistic prevalence of religious rhetoric in technology discourses: 
1.) The anthropomorphization and deification of technology has been an integral 
part of Western discourses since the nineteenth century, shaping our understan- 
dings and expectations. 2.) Religious metaphor is a foundation of our cultural canon 
and can therefore be used to put something abstract and incomprehensible into 
words - and images. 3.) Contrary to what is often assumed, tech pioneers themselves 
often do not share a wholly secular worldview; at the same time, the use of religious 
tropes and motifs can also go hand in hand with an increase in status and serve to 
abdicate personal responsibility. 4.) In current debates, talk ofthe „apocalypse“ can 
also be used to exaggerate the potential ofa company’s products, to distract from the 
more obvious problems of the new technology, and to pre-empt government regu- 
lation. 


1 Einleitung 


Seit seinem Launch hat der Sprachbot ChatGPT das Thema Künstliche Intelligenz in 
den Fokus der Öffentlichkeit gerückt - und für Teile dieser Öffentlichkeit scheint KI 
zu wahrhaft biblischen Assoziationen anzuregen, in Deutschland gleichermaßen 
wie in den USA. „Droht die KI-Apokalypse?“ lautete im Juni 2023 der Titel einer SWR- 
Sendung; im Untertitel wurde die Frage hinterhergeschoben: „Werden neue Tech- 
nologien wie Chat GPT [sic!] und Co zur Gefahr für die Menschheit?“ In Zei- 
tungsartikeln wurde Künstliche Intelligenz 2023 als „Maschinengott“” beschrieben, 
als „god AI,’ als „gottgleich und allwissend“.* Der sich abzeichnende Wettbewerb 


1 SWR Kultur, „Droht die KI-Apokalypse? — Risiken und Chancen von Chat GPT und Co für die 
Wirtschaft“, SWR2 Geld, Markt, Meinung, 15.06.2023, in [https://tip.de/6av67] (Zugriff: 12.10.2023). 
2 Christian Bos, „Der Maschinengott verbirgt seine Gründe“, Kölner Stadt-Anzeiger, 30.03.2023, 22. 
3 John Davidson, „What happens when the god Al arrives“, Financial Review, 16.06.2023, in [https:// 
www.afr.com/technology/what-happens-when-the-god-ai-arrives20230524-pSdasr] (Zugriff: 12.10. 
2023). 
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bei ihrer Entwicklung wurde als Auseinandersetzung „um die Vorherrschaft bei der 
Entwicklung eines digitalen KI-Gottes“ bezeichnet — oder gleich als „Kampf der 
Götter“. In einem Kommentar im Deutschlandfunk sprach ein Politologe von 
„Paradies oder Verderben“,’ die ChatGPT mit sich bringen könnte; nach ersten 
Ansätzen einer Regulierung lobte eine Digitalexpertin, dass nun klar „zwischen 
Wunderwerkzeugen und Höllensystemen“® differenziert werde. Spätestens seit der 
Veröffentlichung des Statement on AI Risk? Ende Mai tauchte im öffentlichen Dis- 
kurs immer öfter der Begriff der Apokalypse auf. Und selbst in Artikeln, die den 
damit einhergehenden Alarmismus in den Medien eher kritisch kommentierten, 
wurden religiöse Bilder beschworen: „Wird die Vorstellung eines strafenden Gottes 
auf KI übertragen, inklusive der Angst, für die eigenen Sünden büßen zu müs- 
sen?“!° — „Sobald der Mensch in Hybris Gott spielt, wird auch dieser Turm zu Babel 
fallen.“'' Ein erstaunlicher Aspekt aktueller Diskurse um Künstliche Intelligenz ist, 
wie oft in ihnen religiöse Sprachbilder auftauchen. 

Einen Beitrag dazu leistet sicherlich auch, dass religiöse Rhetorik seit Jahren 
schon von Tech-Pionier:innen selbst verwendet wird, um die sich vollziehenden 
Entwicklungen zu beschreiben. 2014 warnte Elon Musk davor, dass mit Klein Dä- 
mon beschworen werde;”” 2023 behauptete er in einem Interview mit dem rechten 
Moderator Tucker Carlson, dass innerhalb der Google-Führungsebene Interesse an 
der Schaffung eines digitalen KI-Gottes bestünde.'” Für Aufsehen sorgte 2021 ein 
Interview des früheren Google-Entwicklers Mo Gawdat, in dem dieser äußerte „The 


4 Hanno Rauterberg, „Die Angst vor KI“, Die Zeit, 15.06.2023, 45. 

5 Stefan Stahl, „KI darf nicht zum Monster werden“, Bayerische Rundschau, 06.06.2023, 2. 

6 Christina Kyriasoglou/Jonas Rest, „Kampf der Götter“, manager magazin, 24.03.2023, 36. 

7 Bijan Moini, „ChatGPT und die Folgen: Paradies oder Verderben“ Deutschlandfunk Kultur, 27.03. 
2023, in [https://www.deutschlandfunkkultur.de/kommentar-chat-gpt-ki-100.html] (Zugriff: 12.10. 
2023). 

8 Stefan Krempl, „KI-Verordnung: So reagieren Bürgerrechtler auf die neue Regelung“ heise online, 
11.05.2023, [https:/www.heise.de/news/KI-Verordnung-So-reagieren-Buergerrechtler-auf-die-neue- 
Regelung-9010057.html] (Zugriff: 12.10.2023). 

9 „Statement on Al Risk. Al experts and public figures express their concern about Al risk“, Center 
For AI Safety, 30.05.2023, in [https://www.safe.ai/statement-on-ai-risk] (Zugriff: 12.10.2023). 

10 Christopher Lauer, „Sind Computer böse? Die Künstliche Intelligenz und ihr Mordmotiv“, 
Frankfurter Allgemeine Zeitung, 05.06.2023, 13. 

11 Ralf Otte, „Es gibt kein Auslöschungsrisiko durch diese Künstliche Intelligenz“, Frankfurter 
Allgemeine Zeitung, 19.06.2023, 18. 

12 Vgl. Matt McFarland/Elon Musik, „With artificial intelligence we are summoning the demon“, 
The Washington Post, 24.10.2014, in [https://tlp.de/q2qqi] (Zugriff: 12.10.2023). 

13 Ian M. Giatti, „Elon Musk says Google co-founder wanted to build AI ‚digital god‘“, The Christian 
Post, 20.04.2023, in [https://www.christianpost.com/news/elon-musk-says-google-co-founder-wanted- 
to-build-ai-digital-god.html] (Zugriff: 12.10.2023). 
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reality is, we’re creating God“.'* Und inmitten des Hypes um ChatGPT entschied sich 
Microsoft dazu, einem Projekt, das die GPT-Modelle in die Suchmaschine Bing in- 
tegrieren sollte, den symbolträchtigen Namen des Titanen zu geben, der den 
Menschen das Feuer brachte: Prometheus.’° 

Natürlich sollten wir festhalten, dass religiöse Sprachbilder rein quantitativ als 
Randerscheinung des aktuellen KI-Diskurses angesehen werden sollten. Eine 
oberflächliche Sichtung der mehreren zehntausend Artikel, die seit letztem Jahr 
allein im deutschsprachigen Raum zum Thema ChatGPT erschienen sind, ergibt, 
dass die überwiegende Mehrheit sich (ohne jeglichen eschatologischen Unterton) 
mit praktischen Fragen beschäftigt - etwa, wie KI die Wirtschaft transformieren 
könnte, welche Auswirkungen sie in Schule und Unterricht hat oder wie sie die 
Kulturproduktion verändert. Aber gerade bei Fragen nach den utopischen und 
dystopischen Potenzialen der neuen Technologie scheint sich der Rückgriff auf sehr 
viel ältere Motive anzubieten; im Falle eines die Menschheit beendenden Kata- 
klysmus der der Apokalypse der abrahamitischen Religionen: „Excepting rapture 
theologians of fundamentalist Christianity, popular science authors in robotics and 
artificial intelligence have become the most influential spokespeople for apocalyptic 
theology in the Western world.“’‘ 

Die Verwendung religiöser Sprache, um technologische Entwicklungen zu be- 
schreiben, ist allerdings kein Phänomen, das erst im 21. Jahrhundert aufgetaucht ist. 
Schon seit Ende des 19. Jahrhunderts werden in westlichen Technikdiskursen reli- 
giöse Metaphern bemüht und Verknüpfungen zu Tropen der jüdisch-christlichen 
und griechisch-römischen Mythologie hergestellt. „Die Technik“ als kollektiver 
Singular hat Menschen die letzten 150 Jahre immer wieder dazu eingeladen, zu 
anthropomorphisieren und zu deifizieren — um die Faszination des Neuen in Worte 
zu fassen, um den eigenen Status als Technikentwickler:innen zu erhöhen, mitunter 
auch, um eine Eigendynamik des technischen Fortschritts zu unterstellen oder um 
sich selbst von Verantwortung freizusprechen. Dass wir beim Beschreiben von 
neuen Technologien intuitiv auf Metaphorik zurückgreifen, die Jahrtausende alt ist, 
ist faszinierend und kann uns möglicherweise einiges über unser Technikver- 
ständnis verraten, über die Spuren, die religiöses Denken im Sprachgebrauch der 
Gegenwart hinterlassen hat — und darüber, wie modern „moderne Gesellschaften“ 
wirklich sind. 


14 Dan Robitzski, „Former Google Exec Warns that AI Researchers Are ‚Creating God‘“, The Byte, 
29.09.2021, in [https:/futurism.com/the-byte/google-exec-ai-god] (Zugriff: 12.10.2023). 

15 Vgl. Yusuf Mehdi, „Reinventing search with a new Al-powered Microsoft Bing and Edge, your 
copilot for the web“, Official Microsoft Blog, 07.02.2023, in [https://tlp.de/zws9q] (Zugriff: 12.10.2023). 
16 Robert M. Geraci, Apocalyptic AI. Visions of heaven in robotics, artificial intelligence, and virtual 
reality, New York/Oxford 2010, 8. 
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Im Folgenden möchte ich vier mögliche Deutungen für die vermeintlich ana- 
chronistische Prävalenz religiöser Rhetorik in Technikdiskursen anbieten - die sich 
jedoch gegenseitig nicht ausschließen: 

— Anthropomorphisierendes und deifizierendes Sprechen sowie die Nutzung 
religiöser Metaphorik sind seit dem 19. Jahrhundert ein fester Bestandteil 
westlicher Technikdiskurse und formen unser Verständnis und unsere Er- 
wartungshaltungen. 

— Religiöse Metaphorik bietet sich als Teil unseres kulturellen Kanons aus prag- 
matischen Gründen an, um etwas Abstraktes und Unverständliches in Worte — 
und Bilder - zu fassen. 

— Anders als oft vermutet teilen Technikschaffende selbst oft nicht ein komplett 
säkulares Weltbild; gleichzeitig kann das Benutzen von religiösen Tropen und 
Motiven für sie auch mit einer Statuserhöhung einhergehen und mit dem Ab- 
geben von persönlicher Verantwortung verbunden sein. 

- In aktuellen Debatten um ChatGPT und Large Language Models könnte das 
Sprechen von der „Apokalypse“ auch einem Kalkül entspringen, das die eigenen 
Leistungen übertreibt und versucht, von näher liegenden Problemen der neuen 
Technologie abzulenken und staatlicher Regulierung zuvorzukommen. 


2 Zur Inhärenz von religiöser Sprache in 
westlichen Technik-Diskursen 


Könnten wir eine Zeitreise ins frühe 19. Jahrhundert unternehmen, um mit den 
damals lebenden Menschen über „Technik“ zu sprechen, dann würden wir vor ei- 
nem sehr grundlegenden Problem stehen - nämlich, dass es den Technik-Begriff in 
seiner heutigen Form noch nicht gab. Zwar existierten sowohl das deutsche Wort 
„Technik“ wie auch der englische Begriff „technology“ — allerdings wurden beide 
nicht in ihrer heutigen Bedeutung verwendet: als kollektiver Singular und ab- 
strakter Oberbegriff für die Gesamtheit von Artefakten und Verfahrensweisen. 
Eingeschränkt übernommen wurde diese Funktion von Vorläuferbegriffen wie 
„machinae“ und „Maschinenwesen“.'’ „Technik“ bedeutete lange vor allem so etwas 
wie „Kunst“ oder „Kunstfertigkeit“. 

Lexikometrische Studien machen nachvollziehbar, wie sich die Bedeutung von 
„Technik“ zwischen den 1850ern und 1890ern hin zum modernen Sprachgebrauch 


17 Vgl. hierzu Marcus Popplow, Neu, nützlich und erfindungsreich. Die Idealisierung von Technik in 
der frühen Neuzeit, Münster/New York/München/Berlin 1998. 
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verschob;"® die englischsprachige Forschung geht bei „technology“ sogar von einem 
längeren Prozess aus, der erst in den 1930er Jahren abgeschlossen war.” Als Er- 
klärung für diesen Bedeutungswandel führen Forscher wie Leo Marx einen „se- 
mantic void“ an, der sich durch das Eintreten in die Hochindustrialisierung er- 
öffnete und der einen kollektiven Singular erforderlich machte. Eine Deutung wäre, 
dass sich das erste Mal in der Menschheitsgeschichte viele technische Entwick- 
lungen gleichzeitig vollzogen, was zu einer Anpassung des Sprachgebrauchs führte. 
Und obwohl sich positive und negative Bewertungen bestimmter Technologien mit 
religiöser Aufladung über Jahrhunderte hinweg finden lassen, sind Bewertungen 
‚der Technik an sich‘ somit vergleichsweise jung. 

Dass schon in den ersten Technikdiskursen religiöse Sprachbilder bemüht 
wurden, hängt auch mit der gesellschaftlichen Gruppe zusammen, die entscheidend 
zur Popularisierung des Technikbegriffs beitrug: Die Ingenieure des Deutschen 
Kaiserreichs.”' Die Absolventen der ersten polytechnischen Hochschulen strebten 
schon früh einen höheren Status ihrer Zunft an, die sie als gesellschaftlich bedeu- 
tend, aber als von den bisherigen Geisteseliten vernachlässigt ansahen.”” Besonders 
die Nichtbeachtung durch angesehene Fachrichtungen wie Geschichtswissenschaft 
und Philosophie wurde von vielen ihrer Vertreter schmerzlich empfunden; einer 
der Gründe dafür, dass die Pioniere der modernen Technikgeschichte und Tech- 
nikphilosophie größtenteils selbst den Ingenieurwissenschaften entstammten.” 

Öffentlichkeitswirksame Texte aus Ingenieurshand, die Ende des 19, Anfang 
des 20. Jahrhunderts entstanden, wirkten deshalb oft bemüht, den Duktus der 


18 Vgl. hierzu Andie Rothenhäusler, „Konflikte um Technisches als Ansatzpunkte für eine Biografie 
der Technik“, in Schafft Wissen. Gemeinsames und geteiltes Wissen in Wissenschaft und Technik, hg. 
von Julia Engelschalt et al., Proceedings der 2. Tagung des Nachwuchsnetzwerks ,INSIST“ 07- 
08. Oktober 2016, SSOAR Open Access Repository 2018, 187-202. 

19 Besonders zu nennen: Leo Marx, „The Idea of ‚Technology‘ and Postmodern Pessimism“, in 
Technology Pessimism, and Postmodernism, hg. von Yaron Ezrahi et al., Dordrecht 1994, 11-28 sowie 
Erik Schatzberg, „Technik Comes to America. Changing Meanings of Technology before 1930“, 
Technology and Culture, Bd. 47, 2006, 486-512. 

20 Leo Marx, „Technology. The Emergence of a Hazardous Concept“, Technology and Culture, Bd. 51, 
2010, 561-577, 564. 

21 Ich konzentriere mich in diesem Kapitel auf den deutschsprachigen Diskurs zu „Technik“. Ein 
Überblick zur religiösen Aufladung des Konzepts „technology“ in den USA stammt von dem Tech- 
nikhistoriker David Noble. David F. Noble, The Religion of Technology. The Divinity of Man and the 
Spirit of Invention, New York 1999. 

22 Vgl. hierzu Tobias Sander, „Krise und Konkurrenz - Zur sozialen Lage der Ingenieure und 
Techniker in Deutschland 1900-1933“, in Vierteljahrschrift für Sozial- und Wirtschaftsgeschichte, 
Bd. 91, 2004, 422-451. 

23 Vgl. Wolfgang König, Technikgeschichte. Eine Einführung in ihre Konzepte und Forschungser- 
gebnisse, Stuttgart 2009, 39-40. 
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wilhelminischen Geisteswissenschaften zu imitieren. Dieser operierte mit teleolo- 
gischen Annahmen, transzendentalen Anklängen, Rückgriffen auf die Bibel und auf 
die griechisch-römische Mythologie. Religiöses Vokabular war auch fester Teil 
zeitgenössischer nationalistischer Diskurse: Von den ‚Opfern‘, die für die Einigung 
des Vaterlandes gebracht werden mussten, über das ‚Schicksal‘, welches zu dieser 
geführt hatte, bis zur Bestimmung‘, die dem Deutschen Reich nach seiner Gründung 
zukam. Dementsprechend finden sich in der frühen Ingenieursliteratur Verweise 
auf die Opfer, die auf den Altären der Technik, „auf dem Wege des Fortschritts“,** 
gebracht wurden; Ingenieure deuteten sich selbst als „Jünger der Technik“; in 
Würdigungsreden und Nachrufen wurden Individuen, die sich um die Technik 
verdient gemacht hatten, oft mit Adjektiven wie „gottbegnadet“” bedacht. Einer 
solchen Rhetorik kam der Umstand entgegen, dass der neue kollektive Singular 
Technik zur Anthropomorphisierung - und Deifizierung - einlud. Ein Beispiel für 
den huldigenden Tonfall gegenüber der Technik stammt aus einer Rede, die Alois 
Riedler, Rektor der Technischen Hochschule Berlin, am 9. Januar 1900 zur Feier der 
Jahrhundertwende hielt: „Siegreich ist die Technik auf allen Gebieten vorgedrun- 
gen, alle Lebens- und Schaffensverhältnisse, Menschen- und Völkerdasein hat sie 
tief eingreifend umgestaltet. Die Technik wird auch dem kommenden Jahrhundert 
das Gepräge geben“. 

Nicht bei allen Zeitgenossen stieß solche Rhetorik auf Zustimmung. Der Kul- 
turkritiker Oswald Spengler kommentierte Sprachgebrauch und Technikbild der 
technischen Eliten ein paar Jahrzehnte später: „Mit dem Rationalismus endlich wird 
der Glaube an die Technik‘ fast zur materialistischen Religion: Die Technik ist ewig 
und unvergänglich wie Gott Vater; sie erlöst die Menschheit wie der Sohn; sie er- 
leuchtet uns wie der Heilige Geist.“”® 

Impliziert war in der religiösen Sprache oft auch eine Eigendynamik des 
technischen Fortschrittes, der als geheimnisvolle Naturkraft erschien, die nicht 
aufgehalten werden kann. Diese angenommene Eigendynamik der Technik erlaubte 
ihren ‚Jüngern‘ auch, individuelle Schuld von sich zu weisen: Wenn Technikent- 
wicklung sich unwiderruflich vollzieht, wird der Technikschaffende zum reinen 
Werkzeug einer höheren Macht, der nur das in die Welt bringt, was zwangsläufig in 


24 Max Eyth, Lebendige Kräfte. Sieben Vorträge aus dem Gebiete der Technik, Berlin “1924, 11. 

25 Max Geitel, „Das Wesen und die Bedeutung der Technik“, in Der Siegeslauf der Technik. Erster 
Band, hg. von dems., Stuttgart/Berlin/Leipzig 1922, 1-30, 14. 

26 Carl Weihe/Max Eyth, Ein kurzgefafstes Lebensbild mit Auszügen aus seinen Schriften. Nebst 
Neudruck von Wort und Werkzeug von Max von Eyth, Berlin 1918, 127. 

27 Alois Riedler, Rede zur Feier der Jahrhundertwende am 9. Januar 1900, Berlin 1900, 6. 

28 Oswald Spengler, Der Mensch und die Technik. Beiträge zu einer Philosophie des Lebens, München 
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die Welt kommen wird - selbst, wenn dies negative Konsequenzen hat. Fast scheu 
sprach ein Technikhistoriker ein paar Jahre nach Ende des Ersten Weltkriegs davon, 
dass etwas „von dem Fluche, den der das göttliche Feuer den Menschen bringende 
Prometheus auf sich lud, [...] stets auf den Leistungen der Technik lasten“ wird 
(wohlgemerkt nicht auf den Leistungen der Techniker) — und dass neben der ge- 
bührenden Huldigung es nicht unterlassen bleiben sollte, „die bei so viel Licht 
unvermeidlichen Schatten zu zeichnen“.”® Nach dem Ende des Zweiten Weltkriegs — 
und der beginnenden Debatte um die Verstrickung deutscher Technikeliten in die 
Verbrechen des Nationalsozialismus — sollten manche Tater den kollektiven Sin- 
gular nutzen, um sich selbst freizusprechen, belegt in Zitaten wie „Ich diente nur 
der Technik.“”° Beispiele für solche Entlastungsdiskurse, die das Handeln 
menschlicher Akteur:innen ausblendeten, sind nach 1945 immer wieder zu finden; 
im bayerischen Abitur war 1947 eines der Themen die Frage „Kann die Technik noch 
den Anspruch erheben, eine Wohltäterin der Menschheit zu sein?“ — welche so- 
wohl die vertraute Anthropomorphisierung als auch eine verblüffende Scheu- 
klappensicht auf die letzten 14 Jahre deutscher Geschichte offenbart. 

Ein monolithisches Verständnis ‚der‘ Technik und die Bildung von religiös 
anmutenden Dichotomien sollte auch in den Nachkriegsjahrzehnten lange nach- 
hallen. Ein Beleg dafür ist die „Fluch oder Segen“-Frage des Allensbacher Instituts 
für Demoskopie, die seit 1966 erhoben wurde und in der die Teilnehmer:innen 
befragt wurden: „Glauben Sie, daß die Technik alles in allem eher ein Segen oder 
eher ein Fluch für die Menschen ist?“.”” Ein ähnlich dichotomes Technikverständnis 
prägte auch die Debatte um „Technikfeindlichkeit“, die in den 1980er Jahren in 
Westdeutschland geführt wurde und zu der ich in den letzten Jahren geforscht 
habe.*? In ihr wurde Jugendlichen sowie Vertreter:innen linker Parteien und der 
Gewerkschaften vorgeworfen, den technischen Fortschritt fundamental abzuleh- 
nen. Zu den Wortführern zählte der CSU-Politiker Franz Josef Strauß — der noch 
1984 bei einer Rede festhielt: „Mit der Technik verwirklichen wir den Willen Gottes: 


29 Max Geitel 1922, 30. 

30 Vgl. hierzu die Beiträge im gleichnamigen Band: Museum für Verkehr und Technik (Hg.), Ich 
diente nur der Technik. Sieben Karrieren zwischen 1940 und 1950, Berlin 1995. 

31 Zitiert nach: Kurt A. Detzer, Technikkritik im Widerstreit. Gegen Vereinfachungen, Vorurteile und 
Ideologien, Düsseldorf 1987, 31. 

32 Elisabeth Noelle-Neumann/Edgar Piel (Hg.): Allensbacher Jahrbuch der Demoskopie 1978-1983, 
Bd. 8, München et al. 1983, 511. 

33 Vgl. hierzu Andie Rothenhäusler, „Wegweiser Richtung Steinzeit‘? Die Debatte um ‚Technik 
feindlichkeit‘ in den 1980er Jahren in Westdeutschland“, in Wissenschaftskommunikation, Utopien 
und Technikzukünfte, hg. von Andreas Böhn/Andreas Metzner-Szigeth, Karlsruhe 2018, 281-305. 
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‚Macht euch die Erde untertan!‘““.’* Mit dem Ableben der letzten im Kaiserreich 
geborenen Generation sind solche stark religiös aufgeladenen Bekenntnisse selte- 
ner geworden; allerdings sollten wir ihr Nachwirken nicht unterschätzen. Das Vo- 
kabular, mit dem wir in der Gegenwart operieren, quasi die diskursiven Grundlagen 
moderner Technikdiskurse, wurde von Menschen des 19. Jahrhunderts geprägt, die 
sehr viel weniger säkular waren als wir — und gerade der Hang zu Dichotomien hat 
bis heute Auswirkungen darauf, wie über Technik diskutiert wird. 


3 Religiöse Metaphorik als Mittel, um sich etwas 
Unverständlichem anzunähern 


Es ist naheliegend, dass eine Kultur, in der über Jahrhunderte in religiösen Kate- 
gorien gedacht wurde, auf dieses Fundament zurückgreift, wenn sie etwas Neues in 
Worte und Bilder zu fassen versucht. Als sich im 19. Jahrhundert neue Technologien 
wie Elektrizität und Straßenbeleuchtung in europäischen und amerikanischen 
Städten auszubreiten begannen, war eine Form der Illustration, die sich für Plakate 
anbot, die als Gottheit: Mitunter als leichtbekleidete Lichtgöttin?° triumphierend 
(oder, wie die Technik in Alois Riedlers Ansprache, siegreich voranschreitend), 
mitunter auch wie Prometheus in Ketten gelegt und damit als „mächtige Kraftquelle 
[...] bezähmt“.?* Neben dem male gaze der Illustratoren dürfte ein ganz praktischer 
Grund darin bestanden haben, dass sich Elektrizität schwieriger abbilden lässt als 
etwa Architektur oder Eisenbahnen - sowohl auf Plakaten wie auch in unserer 
Vorstellung. In der Gegenwart scheinen wir vor einem ähnlichen Problem zu ste- 
hen, wenn es darum geht, uns vorzustellen, was Künstliche Intelligenz genau be- 
deutet - möglicherweise ein weiterer Grund dafür, warum religiöse Sprache ihren 
Weg in KI-Diskurse findet. In den Worten der Anthropologin Beth Singler: „[W]hen 
we try to describe the ineffable - the singularity, the future itself - even the most 
secular among us are forced to reach for a familiar metaphysical lexicon. When 
trying to think about interacting with another intelligence [...] and when trying to 


34 Franz Josef Strauß, „Ansprache des Bayrischen Ministerpräsidenten beim Festakt aus Anlaß der 
Eröffnung der Luft- und Raumfahrthalle im Kongreßsaal des Deutschen Museums am 6.5.1984“, 
Kultur & Technik, Bd. 4, 1984, 223-225, 224. 

35 Heike Weber, „Von ‚Lichtgöttinnen‘ und ‚Cyborgfrauen‘: Frauen als Techniknutzerinnen in Vi- 
sion und Werbung“, in Konstruierte Sichtbarkeiten. Wissenschafts- und Technikbilder seit der Frühen 
Neuzeit, hg. von Martina Heßler, München 2006, 317-344, 335-336. 

36 Ebd., 336. 
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imagine the future that such an intelligence might foreshadow, we fall back on old 
cultural habits.“”” 

Was für die Sprache gilt, betrifft auch das Bildmaterial, mit dem Artikel zu 
Künstlicher Intelligenz illustriert werden. Besonders populär sind weiße, andro- 
gyne Roboter in allen denkbaren Formen, was zunehmend als rassistisch proble- 
matisiert wird;** ein anderes beliebtes Motiv sind Darstellungen von Gehirnen mit 
Schaltkreisen. Der Blog NotMyRobots hat es sich in den letzten Jahren zur Aufgabe 
gemacht, auf solche „unrealistic or misleading visualizations of robots, bots, Aland 
other related technology“ hinzuweisen. Zwar mögen humane Darstellungen 
künstlicher Intelligenz oft der Hilflosigkeit eines Presseteams geschuldet sein; sie 
leisten jedoch weiterer Anthropomorphisierung Vorschub: „The media is enthralled 
by images of machines that can do what we can, and often, far better. We are 
bombarded with novels, movies and television shows depicting sentient robots, so it 
is not surprising that we associate, categorise, and define these machines in human 
terms“. * 

Nicht immer wird der Schöpfungsakt durch vermenschlichende Darstellungen 
von Künstlicher Intelligenz nur angedeutet. Eines der beliebtesten KI-Motive der 
letzten Jahre sind Stockfotos, die eine Variation der „Erschaffung Adams“ aus Mi- 
chelangelos Deckenfresko in der Sixtinischen Kapelle darstellen:*' Zwei Hände, 
deren Zeigefinger sich berühren, von denen eine oder beide als Roboterhand ab- 
gebildet werden. Die Implikation ist, dass Technikschöpfung ein quasi-göttlicher Akt 
ist, während menschliche Akteur:innen ausgeblendet werden: „In this way, a ge- 
neral aura of transcendence is attributed to AI, as if AI were the result of a divine 
emanation rather than a human creation subject to possible imperfections.“*” 


37 Beth Singler, „fAIth“, Aeon, 13.06.2017, in [https://aeon.co/essays/why-is-the-language-oftranshu 
manists-and-religion-so-similar] (Zugriff: 12.10.2023). 

38 Vgl. hierzu den Aufsatz von Stephen Cave/Kanta Dihal, „The Whiteness of AI“, Philosophy & 
Technology, Bd. 33, 2020, 685-703. 

39 Vgl. NotMyRobots, in [https:/notmyrobot.home.blog/] (Zugriff: 12.10.2023) 

40 Mark Ryan, „In AI We Trust. Ethics, Artificial Intelligence, and Reliability“, Science and Engi- 
neering Ethics, Bd. 26, 2020, 2749-2767. 

41 Alberto Romele, „Images of Artificial Intelligence. A Blind Spot in AI Ethics“, Philosophy & 
Technology, Bd. 35, 2022, 1-19, 5. 
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4 Die quasi-religiöse Selbstsicht von 
Tech-Pionier:innen 


Das den Schöpfungsakt emulierende Bildmaterial, mit dem Künstliche Intelligenz 
illustriert wird, dürfte nicht der einzige Grund für die enormen Erwartungshal- 
tungen sein, die dem Feld (im Guten wie im Schlechten) entgegengebracht werden. 
Auch die Rhetorik eines Teils derjenigen, die sie entwickeln - vor allem aber vieler 
derjenigen, die sie finanzieren — dürfte einen Anteil daran haben. Als Sam Altman, 
der CEO von OpenAl, 2023 um seine persönliche Einschätzung gebeten wurde, be- 
schrieb er eine Vision, die nahe an biblischen Heilsversprechen ist: „We can make 
the world amazing and we can make people’s lives amazing. We can cure diseases, 
we can increase material wealth, we can, like, help people be happier, more fulfilled, 
all of these sorts of things.“** Im letzten Jahr wurde immer wieder darauf hinge- 
wiesen, wie durchzogen das Silicon Valley des 21. Jahrhunderts von religiösen Ideen 
ist: „The more you listen to Silicon Valley’s discourse around Al, the more you hear 
echoes of religion. That’s because a lot of the excitement about building a super- 
intelligent machine comes down to recycled religious ideas. Most secular techno- 
logists who are building AI just don’t recognize that“.** 

Künstliche Intelligenz - und die befürchtete wie erhoffte Schöpfung einer 
„Artificial General Intelligence“ - ist nur eines der vielen visionären Projekte, 
welche aktuell von Tech-Pionier:innen angedacht und diskutiert werden. For- 
schende wie die Anthropologin Beth Singler deuten diese als moderne Entspre- 
chungen zu eschatologischen Motiven: 


A god-like being of infinite knowing (the singularity); an escape of the flesh and this limited 
world (uploading our minds); a moment of transfiguration or ‘end of days’ (the singularity as a 
moment of rapture); prophets (even if they work for Google); demons and hell [...]. Consciously 
and unconsciously, religious ideas are at work in the narratives of those discussing, planning, 
and hoping for a future shaped by AI.” 


Dazu passt die Popularität von philosophischen Strömungen wie Effective Altruism 
und Longtermism sowie der nachhaltige Anklang, den die Theorie findet, nach der 
wir alle in einer Simulation leben. Allen drei Weltbildern wurde in der Vergan- 


43 Sam Altman, „OpenAl CEO on GPT-4, ChatGPT, and the Future of AI“, Lex Fridman Podcast #367, 
25.03.2023, in [https://youtu.be/L_Guz73e6fw] (Zugriff: 12.10.2023). 

44 Sigal Samuel, „Silicon Valley’s vision for AI? It’s religion, repackaged“, Vox, 07.09.2023, in [https:// 
www.vox.com/the-highlight/23779413/silicon-valleys-ai-religion-transhumanism-longtermism-ea] 
(Zugriff: 12.10.2023) 
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genheit vorgeworfen, den Charakter von säkularen Religionen zu haben, die mit 
Heilsversprechen arbeiten - und die alle in der einen oder anderen Form auf einem 
eschatologischen Weltbild aufbauen: „The simulation is little more than digital 
Calvinism, with an omnipotent divinity that preordains the future. The singularity is 
digital messianism, as found in various strains of Judeo-Christian eschatology—a 
pretty basic onscreen Revelation. Both visions are fundamentally apocalyptic“.* 
Ahnlich wie die Eigendynamik, die viele Technikschaffende in Deutschland in 
der ersten Halfte des 20. Jahrhunderts dem technischen Fortschritt zusprachen, 
kann auch das quasi-religidse Weltbild, das die CEOs großer Tech-Unternehmen 
nach außen kommunizieren, unterschiedlich interpretiert werden: Als Erhöhung 
des eigenen Status; als Freisprechen von persönlicher Verantwortung angesichts 
der Teleologie technischer Entwicklung. Nicht unerwähnt bleiben sollte jedoch die 
Möglichkeit, dass religiöse Rhetorik auch aus einem Kalkül heraus bedient wird. 


5 Kalkuliertes Warnen vor der Apokalypse? 


Ein wichtiger Grund dafür, dass gerade das Motiv der Apokalypse so prominent im 
medialen Diskurs der letzten Monate auftauchte, dürften mehrere offene Briefe 
sein, die von Entwickler:innen formuliert und von Firmen wie OpenAl selbst mit- 
getragen wurden. Besonders zu nennen ist der Ruf nach einem sechsmonatigen 
Moratorium mit dem Titel Pause Giant AI Experiments,’ der im März 2023 veröf- 
fentlicht wurde, sowie das Statement on AI Risk,* das zwei Monate später erschien 
und von Industriegrößen wie Sam Altman (OpenAl), Demis Hassabis (Google 
DeepMind), Bill Gates und vielen anderen CEOs großer Tech-Firmen unterzeichnet 
wurde. In den beiden Texten selbst wird keine religiöse Rhetorik verwendet - sie 
schildern nur die möglichen Gefahren von KI-Entwicklung in gravierenden Tönen 
und als essenzielle Bedrohung für die Menschheit. In Pause Giant AI Experiments 
werden u.a. die Fragen aufgeworfen: „Should we develop nonhuman minds that 
might eventually outnumber, outsmart, obsolete and replace us? Should we risk loss 
of control of our civilization?“* Das Statement on AI Risk besteht aus einem einzigen 


46 Stephen Marche, „Of God and Machines“, The Atlantic, 15.09.2022, in [https://tlp.de/wfhpx] (Zu- 
griff: 12.10.2023). 

47 „Pause Giant AI Experiments. An Open Letter“, Future of Life Institute, 22.03.2023, in [https://futu 
reoflife.org/open-letter/pause-giant-ai-experiments/] (Zugriff: 12.10.2023). 

48 „Statement on AI Risk. Al experts and public figures express their concern about Al risk“, Center 
For AI Safety, 30.05.2023, in [https://www.safe.ai/statement-on-ai-risk] (Zugriff: 12.10.2023). 

49 „Pause Giant AI Experiments. An Open Letter“, Future of Life Institute, 22.03.2023, in [https://futu 
reoflife.org/open-letter/pause-giant-ai-experiments/] (Zugriff: 12.10.2023). 
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Satz: „Mitigating the risk of extinction from AI should be a global priority alongside 
other societal-scale risks such as pandemics and nuclear war.“ Dass solche War- 
nungen gerade von denjenigen ausgesprochen wurden, die den Entwicklungen von 
KI am nächsten zu stehen scheinen, sorgte nachvollziehbarerweise für Sorgen in 
Medien und Bevölkerung - eine YouGov-Umfrage, die zwei Wochen nach dem Er- 
scheinen von Pause Giant AI Experiments durchgeführt wurde, kam zu dem Er- 
gebnis, dass fast die Hälfte der Befragten in den USA „very or somewhat concerned 
about the possibility“ seien, „that artificial intelligence, or AI, will cause the end of 
the human race on Earth“. 

Die Untergangswarnungen aus dem Silicon Valley ernteten jedoch früh schon 
Kritik. Schon vor Erscheinen der beiden offenen Briefe war darauf hingewiesen 
worden, dass Debatten um hypothetische „killer robots“ von der disruptiven Wirkung 
ablenken würden, die Sprachmodelle wie ChatGPT kurz- und mittelfristig für Ar- 
beitsmärkte weltweit haben könnten.” In den Folgemonaten wurde von Akti- 
vist:innen und Forschenden wie der Computerlinguistin Emily Bender die Vermu- 
tung geäußert, dass es sich bei der „Erzählung von der Apokalypse, wie sie die KI- 
Unternehmer streuen“, um ein „Ablenkungsmanöver“” handele, welches von den 
konkreten Problemen der Gegenwart ablenken solle: Die Anfälligkeit der Sprach- 
modelle für Diskriminierung und die Konzentration von Gestaltungsmöglichkeiten in 
den Händen von nur wenigen mächtigen Akteur:innen. Auch Probleme wie Desin- 
formation oder der ökologische Impact, den die Nutzung von Sprachmodellen mit 
sich bringe,°* würden durch die Untergangsrhetorik aus dem Blick geraten - ganz zu 
schweigen von einem fundamentalen Wandel des Arbeitsmarktes, der sich dadurch 
ergebe, wenn viele Unternehmen menschliche Arbeitskräfte durch KI ersetzen.” 


50 „Statement on AI Risk. AI experts and public figures express their concern about Al risk“, Center 
For AI Safety, 30.05.2023, in [https://www.safe.ai/statement-on-ai-risk] (Zugriff: 12.10.2023). 
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Verschiedentlich wurde darauf hingewiesen, dass die geforderten Moratorien 
nicht notwendigerweise schädlich für etablierte Unternehmen wie OpenAl seien, 
die bereits funktionstüchtige Apps gelauncht hatten,” allerdings Probleme für 
kleinere Firmen mit sich bringen könnten, die am Aufholen sind.” Ein genereller 
Kritikpunkt war die Doppelzüngigkeit der Tech-Branche, die vor einer technologi- 
schen Entwicklung warne, die sie selbst weiterhin kräftig vorantreibe: „If they 
honestly believe that this could be bringing about human extinction, then why not 
just stop?“ So schien Sam Altman bei seinem Europabesuch kurz nach Veröf- 
fentlichung des Statement on AI Risk vor allem damit beschäftigt, Lobbyarbeit gegen 
eine Regulierung von Sprachmodellen durch die EU zu betreiben.” Elon Musk 
wiederum, der als einer der ersten den Ruf nach einem sechsmonatigen Morato- 
rium unterzeichnet hatte, gab nur einen Monat nach Erscheinen die Gründung von 
„IruthGPT“ bekannt, einem Sprachmodell, das auf die ‚woken‘ Restriktionen von 
ChatGPT verzichten solle.” 

Angesichts der offensichtlichen Widersprüche zwischen Rhetorik und Handeln 
wurde verschiedentlich der Verdacht geäußert, dass es sich bei dem neuen „Techno 
Doomerism“,°' „AI Doomerism“ oder „Criti-Hype“” vor allem um eine Marketing- 
Strategie der Tech-Branche handle, die dazu diene, das Potenzial der eigenen Pro- 
dukte zu übertreiben. Die Annahme, dass KI die Menschheit auslöschen könne, 
„provides a tacit advertisement: The CEOs, like demigods, are wielding a technology 
as transformative as fire, electricity, nuclear fission, or a pandemic-inducing virus. 
You’d be a fool not to invest“. Gleichzeitig könnten die Warnungen vor der Apo- 
kalypse von den Firmen eingesetzt werden, „to inoculate them from criticism, co- 
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pying the crisis communications oftobacco companies, oil magnates, and Facebook 
before: Hey, don’t get mad at us; we begged them to regulate our product“.°* 

Als weitere Motivation wurde vermutet, dass die absehbare Regulierung den 
KI-Firmen nicht von außen aufgezwungen, sondern von ihnen selbst angestoßen 
werde, was größere Gestaltungsmöglichkeiten biete. „Die zugrunde liegende Bot- 
schaft: Es sollten Organisationen wie OpenAl sein, die die Gesellschaft in eine 
schöne neue Welt lenken.“°® 


6 Fazit 


Die Gründe für den religiösen Sprachgebrauch in Technikdiskursen sind viel- 
schichtig — und die Frage ist nicht leicht zu beantworten, warum Menschen auf 
Begriffe aus der Bibel oder der griechisch-römischen Mythologie zurückgreifen, 
wenn sie eine neue Technologie (oder „die Technik“ an sich) zu beschreiben ver- 
suchen. Eine Beschäftigung mit diesem Thema ist von Belang, weil sie uns erlaubt, 
einen Blick in die unausgesprochenen Grundannahmen und Denkmuster der 
westlichen Moderne zu werfen und die Dichotomien zu dekonstruieren, die in 
diesen angelegt sind. „Fluch“ und „Segen“, „Mensch“ und „Technik“ sind Gegen- 
überstellungen, die problembehaftet sind - die erstere, weil sie keinen Raum für 
Ambivalenzen lässt, die letztere, da sie eine inhumane Eigendynamik des techni- 
schen Fortschritts impliziert, welche die Schöpfer:innen aus der eigenen Verant- 
wortung entlässt. Eine weitere Dichotomie ist jene von „Glaube“ und „Wissen- 
schaft“; wie hoffentlich ersichtlich wurde, birgt sie das Problem, dass 
Technikschaffende oft die eigene Objektivität voraussetzen, wenn sie sich zu ge- 
sellschaftlichen und politischen Fragen äußern, da sie eigene Glaubenssätze nicht 
als solche verstehen. 

Abseits von utopischen wie dystopischen Szenarien gilt es immer wieder zu 
betonen, dass Technikentwicklung von Menschen gemacht wird und sich der Menge 
an Mitsprachemöglichkeiten anpasst. Das beispiellose Monopol, das kleine Gruppen 
von Akteuriinnen am Anfang eines Entwicklungsprozesses innehaben, lädt zu 
Mystifizierung ein - sei es aus persönlicher Eitelkeit heraus oder aus dem Streben 
nach Anerkennung der eigenen Leistungen. 

Die Frage, ob Künstliche Intelligenz eines Tages „gottgleich“ sein und mögli- 
cherweise sogar die Apokalypse herbeiführen wird, ist sehr viel schwieriger zu 
beantworten als die Frage, ob KI-Einsatz schon jetzt negative Auswirkungen hat, die 
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eine gesellschaftliche Intervention (und staatliche Regulierung) erfordern. Falls es 
gelingt, den gesellschaftlichen Diskurs auf diese kurz- und mittelfristigen Probleme 
zu lenken, hätten die Warnungen vor dem Untergang zumindest ein Ziel erreicht: 
Eine breite und lebhafte Debatte anzustoßen. 


IV Interpretation und Hermeneutik 


Torsten Hiltmann 
Hermeneutik in Zeiten der KI 


Large Language Models als hermeneutische Instrumente in den 
Geschichtswissenschaften 


Abstract: Large language models (LLMs) such as ChatGPT are capable of impressive 
textual analysis and interpretation. This paper explores their potential as a „her- 
meneutic tool“ in historical research. Using a Middle High German chronicle as an 
example, the paper shows how ChatGPT can accurately categorize unfamiliar texts 
and clarify ambiguous passages. However, it reaches its limits when it comes to 
more specific historical contexts. By analyzing the underlying technology, the paper 
shows how LLMs appear to understand texts while actually generating them based 
on the „mechanics“ of statistically trained models. In doing so, this study demon- 
strates that these models can be of great assistance in historical research, but that 
true interpretation of historical texts and events still requires human understan- 
ding. 


Das neue Register wird vor allem meinem 
Mitarbeiter an der Ausgabe, Herrn Knut Eming, 
verdankt. Unser Bestreben war, bei häufigeren 
Begriffen die Hauptstellen sichtbar zu machen, 
insbesondere auch, damit die 

Zusammengehörigkeit von Band 1 und 2 deutlich wird. 


Was der Computer nie lernen wird, sollte von uns 
wenigstens in Annäherung geleistet werden. 
(Hans-Georg Gadamer, Vorwort zu Band 1, 

Wahrheit und Methode, seiner Gesammelte Werke’) 


Mit dieser kurzen Bemerkung im Vorwort zu seinen Gesammelten Werken äußert 
Hans-Georg Gadamer, einer der wichtigsten Autoren zur Hermeneutik, sichtbare 
Skepsis gegenüber der Möglichkeit, Computer in hermeneutische Prozesse zu in- 
tegrieren. Angesichts des damaligen Technologieniveaus erscheinen seine Zweifel 
auch berechtigt. Zugleich zielen solche kritischen Einschätzungen bezüglich des 
Computers aber auch häufig darauf ab, die Einzigartigkeit menschlicher Fähigkei- 
ten hervorzuheben, gerade wenn es um komplexe intellektuelle Prozesse geht. 


1 Hans-Georg Gadamer, Gesammelte Werke, Bd.1, Hermeneutik I. Wahrheit und Methode. Grundzüge 
einer philosophischen Hermeneutik, Tübingen 1986, xix. 
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Mit dem Aufkommen von Large Language Models (LLM) und Chatbots wie 
ChatGPT scheint diese Einschätzung jedoch ins Wanken zu geraten. Der folgende 
Beitrag soll daher der Frage nachgehen, in welchem Maße diese neuen Technolo- 
gien tatsächlich über eigenständige hermeneutische Fähigkeiten verfügen und wie 
sie möglicherweise unsere gesamte hermeneutische Methode beeinflussen können. 
Dies soll dabei am Beispiel der Geschichtswissenschaften näher untersucht werden, 
die sich selbst als eine vorrangig textbasiert arbeitende hermeneutische Disziplin 
verstehen. Wenn im Folgenden von „Künstlicher Intelligenz“ die Rede ist, bezieht 
sich dies im Kontext des Beitrags auf jenen spezifischen Teilbereich, der seit der 
Veröffentlichung von ChatGPT im November 2022 die aktuelle Diskussion maß- 
geblich pragt:? LLM und die dazugehörigen Transformer-Modelle.? 

Bevor die hermeneutischen Potenziale der LLM näher beleuchtet werden, be- 
darf es zunächst einer kurzen Einführung in die Geschichtswissenschaften und 
ihrer Verbindung zur Hermeneutik, welche den Rahmen für diese Untersuchung 
bilden. 


1 Geschichtswissenschaften und Hermeneutik 


Die Geschichtswissenschaften zielen darauf ab, historische Prozesse und Entwick- 
lungen zu verstehen, um die Entstehungsbedingungen unserer Gegenwart zu er- 
klären. Hierfür nutzen sie verschiedene Artefakte und Äußerungen aus der Ver- 
gangenheit als Quellen, um historische Zustände und Ereignisse zu rekonstruieren. 
Das ultimative Ziel ist es, historische Geschehnisse zu verstehen und zu interpre- 
tieren, um fundierte Einsichten zu erlangen. Diese Einsichten sind jedoch niemals 
absolute Wahrheiten, da sie stets der Interpretation und subjektiven Deutung un- 
terliegen. 

Die Hermeneutik spielt daher eine zentrale Rolle in der historischen Wis- 
sensproduktion. Sie befasst sich mit dem Verstehen und Interpretieren historischer 
Quellen und mit dem Nachvollziehen und Verstehen vergangener Ereignisse und 


2 Steffen Albrecht, „ChatGPT und andere Computermodelle zur Sprachverarbeitung — Grundlagen, 
Anwendungspotenziale und mögliche Auswirkungen“, Institut für Technikfolgenabschätzung und 
Systemanalyse (ITAS), Karlsruher Institut für Technologie (KIT), 21.04.2023 (DOI: 10.5445/IR/ 
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Prozesse.* Die Definition der Hermeneutik ist komplex und variiert je nach Autor, 
Fach, Fragestellung und Perspektive. Grundsatzlich kann sie aber als Theorie und 
Methodik der Interpretation von Texten und des Verstehens von Sinnzusammen- 
hängen in menschlichen Lebensäußerungen zusammengefasst werden. Ursprüng- 
lich auf religidse und philosophische Texte begrenzt, hat sich ihr Anwendungsgebiet 
auf zahlreiche weitere Disziplinen ausgedehnt. Wilhelm Dilthey definierte die 
Hermeneutik schließlich als ein zentrales Merkmal der Geisteswissenschaften, das 
sie von den Naturwissenschaften unterscheidet.” Während die Naturwissenschaf- 
ten sich auf beobachtbare Phänomene und ihre Erklärung konzentrierten, legten 
die Geisteswissenschaften vor allem Wert auf Verstehen und Plausibilität. Dabei 
kommt der Geschichtlichkeit eine wesentliche Bedeutung zu, da in den Geistes- 
wissenschaften das Verständnis bestimmter Phänomene, wie diese selbst, zeitge- 
bunden und daher veränderlich ist. 

Auch die Hermeneutik hat sich erst über die Zeit entwickelt.° Ursprünglich 
stammt der Begriff aus dem Griechischen (punvevety, hermäneuein) und bedeutet 
so viel wie „erklären“, „verstehen“, „deuten“ und „übersetzen“. Schon Aristoteles 
und Platon betonten den Unterschied zwischen dem buchstäblichen und dem ver- 
borgenen Sinn von Texten. Seit der Spätantike ging es dann zunächst um die In- 
terpretation der Bibel, ob - wie im Mittelalter - nach den vier Bedeutungsebenen 
oder - im Rahmen der Reformation — nach dem Prinzip „sola scriptura“, das eine 
Interpretation der Schrift ausschließlich aus sich selbst heraus vorsieht. Erst im 
17. Jahrhundert unterschied Johann Conrad Dannhauer die „Hermeneutik“ als die 
allgemeine Interpretationslehre von der Exegese als der Auslegung biblischer 
Texte.’ Chladenius führt dann 1742 das Konzept des „Sehepunkts“ ein, wonach die 
verschiedenen Umstände, die uns prägen, letztlich zu verschiedenen Perspektiven 
auf die Dinge führen, weshalb man von verschiedenen Sehepunkten aus auch 
verschiedene Vorstellungen einer Sache haben kann. Entsprechend sollte man für 


4 Vgl. einführend: Stefan Jordan, „Hermeneutik“, in Handbuch Methoden der Geschichtswissen- 
schaft, hg. von Stefan Haas, Wiesbaden 2020, 1-15 (DOI: 10.1007/9783-658-277987_8-1). 

5 Vgl. Wilhelm Dilthey, Einleitung in die Geisteswissenschaften Versuch einer Grundlegung für das 
Studium der Gesellschaft und der Geschichte, hg. von Bernhard Groethuysen, Stuttgart/Göttingen 
1990 (Gesammelte Schriften, Bd. 1). Diese deutliche Abgrenzung, die später umfangreich diskutiert 
und z.T. auch revidiert wurde, ist dabei vor allem aus den Umständen der Zeit heraus zu verstehen, 
in der die Naturwissenschaften eine immer größere Bedeutung gewannen, vgl. Christian Damböck/ 
Hans-Ulrich Lessing (Hg.), Dilthey als Wissenschaftsphilosoph, Freiburg/München 2016. 

6 Für einen Überblick zur historischen Entwicklung der Hermeneutik, siehe: Gadamer 1986, 177- 
269. 

7 Zu Dannhauer siehe insbesondere: Gerhardt Kurz, Hermeneutische Künste. Die Praxis der Inter- 
pretation, Stuttgart 2020, 193-201 (DOI: 10.1007/9783-476-04686-4_8). 
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die Interpretation seinen eigenen und den Sehepunkt des Autors ermitteln, um 
einen Text besser nachvollziehen zu kénnen.® 

Friedrich Schleiermacher hat die Kunst der Hermeneutik zu Beginn des 
19. Jahrhunderts entscheidend weiterentwickelt, indem er verstärkt die histori- 
schen und kulturellen Rahmenbedingungen einbezog, in deren Kontext ein Text 
entstanden ist.’ Damit erweiterte er die rein textimmanente Interpretation um das 
Eindenken in die konkreten Lebensumstände der Autoren und ihrer Zeit und schuf 
damit die Grundlagen für eine umfassende (universale) Hermeneutik, die dann 
auch in so diversen Feldern wie der Literatur, dem Recht oder der Philosophie 
Anwendung fand. So auch in den Geschichtswissenschaften. 

Schon Wilhelm von Humboldt beschreibt in seiner Akademierede die Aufgabe 
des Historikers als die eines Übersetzers.'° Das bedeutet, die Vergangenheit nicht 
nur zu rekonstruieren, sondern auch zu interpretieren und der Gegenwart zu 
vermitteln. Eine Idee, die dann vor allem durch Johann Gustav Droysen weiter- 
entwickelt wurde." Er machte das ‚Verstehen‘ zu einem rationalen Verfahren in 
den Geschichtswissenschaften, das in seinem Dreischritt aus Heuristik (der syste- 
matischen Suche und Sammlung von Quellen), Kritik (der Bewertung der Glaub- 
würdigkeit und Relevanz dieser Quellen) und Interpretation (der Deutung und 
Analyse der gewonnenen Erkenntnisse) bis heute das methodische Fundament der 
Disziplin bildet. Dabei geht es nicht nur um ein angemessenes Verständnis der 
Quellen, sondern auch der darin vermittelten Handlungen und Ereignisse.'? 

Bei alledem sind jedoch auch die Geschichtswissenschaften dem hermeneuti- 
schen Zirkel unterworfen, oder, wie es Droysen ausdrückte: „Das Einzelne wird 
verstanden in dem Ganzen, und das Ganze aus dem Einzelnen.“'® Zwar lässt sich die 
Idee des hermeneutischen Zirkels bis in die Antike zurückverfolgen, doch wurde er 
spätestens seit Schleiermacher auch entsprechend theoretisiert:'* demnach könne 
ein Ganzes nur verstanden werden, wenn man seine Einzelteile versteht und um- 
gekehrt. Entsprechend lassen sich zum Beispiel Aussagen in einer Urkunde nur im 
Kontext des gesamten Dokuments verstehen und die gesamte Urkunde nur aus 


8 Siehe ebd., 206-208. 

9 Vgl. Friedrich Schleiermacher, Hermeneutik und Kritik, hg. und eingeleitet von Manfred Frank, 
Frankfurt a.M. 1977. Zur entsprechenden Einordnung der Hermeneutik Schleiermachers, vgl. Ga- 
damer 1986, 188-201. 

10 Wilhelm von Humboldt, „Ueber die Aufgabe des Geschichtschreibers“, in Werke, hg. von Albert 
Leitzmann, Bd. 4, Berlin 1905, 38. 

11 Gadamer 1986, 216-222. 

12 Vgl. Johann Gustav Droysen, Grundriss der Historik, Leipzig 1868. 

13 Ebd., 10. 

14 Vgl. Gadamer 1986, 270-281. 


Hermeneutik in Zeiten der KI — 205 


ihren einzelnen Aussagen. Das bedeutet — und hier nähern wir uns der Frage der 
Hermeneutik im Zusammenhang mit LLM -, dass es für jedes Verstehen bereits ein 
Vorwissen oder ein Vorverständnis braucht, vor allem aber immer den Einbezug 
von Kontext. 

Unter anderem aufbauend auf den Ideen von Wilhelm Dilthey, erweiterte Hans- 
Georg Gadamer in Wahrheit und Methode das Konzept der Hermeneutik maftgeb- 
lich, wobei er auch die Geschichtswissenschaften in den Blick nimmt." Zentrale 
Bestandteile des Verstehensprozesses sind fur ihn dabei Sprache und Bildung. Auf 
Heidegger basierend, betont Gadamer die prägende Rolle der Sprache für unser 
Denken. Die Welt wird durch Sprache erfahren und begriffen. Dabei geht die 
Sprache den Individuen voraus, sodass wir stets an einen bestimmten sprachlichen 
Verstehensrahmen gebunden sind.’ Das heißt, dass wir durch unsere Sprache 
bereits voreingenommen sind, was in Bezug auf die LLM interessante Fragen auf- 
wirft. 

Eine weitere wesentliche Voraussetzung für das Verstehen ist die Bildung, die 
man aus verschiedenen Erfahrungen erworben hat. Sie bildet den Verstehensho- 
rizont, an den wir in unserem Verstehen anknüpfen können. Bei Gadamer wird 
dieser vorrangig durch Traditionen bzw. Wirkungsgeschichten geprägt, etwa im 
Hinblick auf das Verständnis bestimmter Texte und Objekte. So erlernen wir zu- 
nächst, wie Dinge bislang über die Zeit verstanden wurden, und können auf dieser 
Basis dann einen Text oder Gegenstand in unserer Zeit neu erfassen und damit 
dessen Bedeutung erweitern." 

Charakteristisch für Gadamers Hermeneutik ist vor allem die Rolle des „Vor- 
Urteils“: eine spezifische, individuelle Voreinstellung zum Verstehensobjekt. Ga- 
damer sieht diese subjektive Voreinstellung dabei nicht als Hindernis, sondern als 
notwendige Voraussetzung für das Verstehen. Ohne irgendeine Form von Vor-Urteil 
ist nach Gadamer auch kein Verstehen möglich. Für ihn bedeutet Verstehen ins- 
besondere die Bereitschaft, im Dialog mit dem zu verstehenden Gegenstand seine 
Vor-Urteile zu hinterfragen und gegebenenfalls zu revidieren.'® Die Hermeneutik ist 
somit ein fortwährender Prozess der Weltaneignung, der grundsätzlich nie endet — 
wobei Verstehen vor allem meint, die richtigen Fragen zu stellen. 


15 Vgl. ebd., 177-384. 
16 Vgl. ebd., 387-494. 
17 Vgl. ebd., 305-312. 
18 Vgl. ebd., 281-296. 
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2 Hermeneutik und Digitalitat 


Wenn wir die Auswirkungen neuer digitaler Technologien wie LLM auf die Her- 
meneutik näher untersuchen wollen, wird schnell deutlich, dass die Einbindung 
dieser Technologien eine fundamentale Verschiebung der Rahmenbedingungen mit 
sich bringt. Mit dem Computer tritt ein Element hinzu, das den hermeneutischen 
Prozess offenbar von Grund auf verändert und damit die traditionelle, analoge 
Hermeneutik von der Hermeneutik im digitalen Raum unterscheidet. 

Im Kontext von LLM und textgenerierenden Modellen wie ChatGPT stellt sich 
die Frage nach der Hermeneutik daher gleich in doppelter Hinsicht: zum einen 
bezüglich der Fähigkeit der Maschine, Texte zu interpretieren, und zum anderen 
hinsichtlich unserer Interaktion mit der Maschine und den von ihr produzierten 
Texten selbst. 


3 Digitalität als Grundlage 


Grundlage für alle hier besprochenen Verfahren und Techniken ist die Digitalisie- 
rung, welche das Fundament für hermeneutische Ansätze und Methoden maß- 
geblich verändert hat. Die Digitalisierung ist ein tiefgreifender technologischer und 
kultureller Transformationsprozess, der sich aus einem zentralen Medienwandel 
speist, der in seiner Tragweite nur mit der Entstehung der Sprache oder Schrift 
vergleichbar ist.’® Digitalität ist eine neue Form der Informationsrepräsentation, 
die die Bereitstellung und Vermittlung von Informationen radikal verändert hat. 
Die herkömmliche Informationsvermittlung durch das gesprochene Wort oder die 
Einschreibung in physische Medien wurde hier durch ein System erweitert, das 
Informationen in eine Abfolge von für sich genommen bedeutungslosen Zeichen 
kodiert. Diese lassen sich elektronisch verarbeiten, rekonstruieren und interpre- 
tieren. Damit sind Inhalt und Form getrennt, sodass die so repräsentierten Infor- 
mationen sich unendlich oft vervielfältigen, teilen, bearbeiten und immer wieder 
neu arrangieren lassen. 


19 Vgl. Torsten Hiltmann, „Vom Medienwandel zum Methodenwandel. Die fortschreitende Digita- 
lisierung und ihre Konsequenzen für die Geschichtswissenschaften in historischer Perspektive“, in 
Digital History. Konzepte, Methoden und Kritiken Digitaler Geschichtswissenschaft, hg. von Karoline 
Dominika Döring et al., Berlin/Boston 2022, 13-44 (DOI: 10.1515/9783110757101-002). 
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Daraus ergeben sich erhebliche Konsequenzen, die auch für die Hermeneutik 


wichtig sind, u.a.:” 


Veränderter Zugang zu Wissen: Der Zustand der Digitalität hebt die Bindung 
von Informationen an ein spezifisches physisches Objekt auf und ermöglicht es, 
Wissen und damit auch Kontextwissen in einer vernetzten, globalen Infra- 
struktur bereitzustellen. 

Modellierung und Formalisierung: Informationen und ihre Zusammenhänge 
müssen für die Nutzung in einer digitalen Welt in irgendeiner Form formali- 
siert werden. Dies beinhaltet immer auch eine Form der Selektion und der 
Abstraktion, was wiederum das Verständnis und die Interpretation dieser In- 
formationen beeinflussen kann. 

Beeinflussung durch Algorithmen: Unsere Interaktionen im digitalen Raum 
werden maßgeblich durch Algorithmen geformt. Sei es die Suchmaschine als 
zentraler Zugang zum World Wide Web oder die Algorithmen der Modelle, die 
Texte analysieren oder generieren - unser Verstehen ist stets einem algorith- 
mischen Filter und damit auch möglichen Biases unterworfen, sind die Algo- 
rithmen, wie auch die zuvor genannten Modelle, doch stets in einem be- 
stimmten Kontext mit einem bestimmten Zweck entstanden. 

Skalierung: Die Digitalität ermöglicht die algorithmische Verarbeitung von 
riesigen Datenmengen, die weit über menschliche Verständnishorizonte hin- 
ausgehen. Hierdurch können wesentlich umfangreichere Kontexte berück- 
sichtigt werden als bisher. 

Medienkonvergenz: Im Zuge der Digitalisierung werden verschiedene Medien- 
formate in ein einheitliches Format überführt, was eine gemeinsame Bear- 
beitung und Verknüpfung dieser Inhalte ermöglicht und zu einer erheblichen 
Erweiterung des zur Verfügung stehenden Informationsraums führt. 


Es lässt sich festhalten, dass die Digitalität die Grundlagen für das Verständnis von 
Texten, ebenso wie für das Verständnis der Welt, tiefgreifend verändert. Die neuen 
Möglichkeiten bringen dabei ganz erhebliche Herausforderungen mit sich, die esin 
der zukünftigen Forschung zu adressieren gilt. 


20 Zu den zentralen Konsequenzen der Digitalisierung bzw. der Verwendung digitaler Methoden in 
den Geschichtswissenschaften, siehe: Torsten Hiltmann, „(Epistemologische) Grundlagen in der 
Anwendung digitaler Methoden“, in Digital Humanities in der Geschichtswissenschaft, hg. von 
Christina Antenhofer et al., Wien et al. 2023, 43-59 [im Druck]. 
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4 Digitale Hermeneutik - Digitales Textverstehen 


Die Diskussion zur digitalen Hermeneutik kann bisher in drei Hauptströmungen 
unterschieden werden. Das ist erstens die kritische Auseinandersetzung mit den 
Eigenschaften digitaler Quellen und den daraus resultierenden Herausforderungen, 
einschließlich Daten-, Algorithmus- und Schnittstellenkritik. Diese digitale Herme- 
neutik zielt darauf ab, die klassische Hermeneutik an das digitale Zeitalter anzu- 
passen, indem die interpretatorische Praxis im Kontext neuer technologischer Be- 
dingungen reflektiert wird.” Zweitens die Entwicklung und Implementierung 
neuer computergestützter Methoden zur Unterstützung des Textverstehens, wobei 
gerade hier auch der Bedarf an Theorien thematisiert wird, welche diese neuen 
Methoden stützen und untermauern kénnen.” Eine dritter Diskursstrang schließ- 
lich beschäftigt sich mit der Frage der Datenhermeneutik, also mit dem Verstehen 
von und mit Daten.” Denn in den Geisteswissenschaften sind Daten, wie auch Texte 
oder Bilder, letztlich Repräsentationen menschlichen Schaffens. Dennoch soll es im 
Folgenden zunächst um das Verstehen von Texten und historischen Zusammen- 
hängen gehen. 

Eine ganz besondere Perspektive bieten in diesem Zusammenhang Stefan 
Sinclair und Geoffrey Rockwell in ihrer „Hermeneutica. Computer-Assisted Inter- 
pretation in the Humanities“”*, in der sie Theorie, Methode und Praxis aufs engste 
miteinander verbinden. Die beiden Entwickler der „Voyant Tools“”° argumentieren 


21 Vgl. hierzu v.a. Andreas Fickers, „Update für die Hermeneutik. Geschichtswissenschaft auf dem 
Weg zur digitalen Forensik?“ Zeithistorische Forschungen, Bd. 17(1), 2020, 157-168 (DOI: 10.14765/ 
zzf.dok-1765) und zuletzt den Sammelband Digital History and Hermeneutics, Between Theory and 
Practice, hg. von Andreas Fickers/Juliane Tatarinov, Berlin/Boston 2022 (DOI: 10.1515/9783110723991). 
22 Vgl. Joris J. Van Zundert, ,Screwmeneutics and Hermenumericals: The Computationality of 
Hermeneutics“, in A New Companion to Digital Humanities, hg. von Susan Schreibman et al., 
Hoboken (New Jersey) 2015, 331-347 (DOI: 10.1002/9781118680605.ch23); John Mohr et al., „Toward a 
Computational Hermeneutics“, Big Data & Society Bd. 2(2), 2015 (DOI: 10.1177/2053951715613809); 
Alberto Romele et al., „Digital Hermeneutics. From Interpreting with Machines to Interpretational 
Machines“, AI & Society, Bd. 35(1), 2020, 73-86 (DOI: 10.1007/s00146-018-0856-2). 

23 Vgl. Amelia Acker, „Toward a Hermeneutics of Data“, IEEE Annals of the History of Computing, 
Bd. 37, 2015, 70-75; Paolo Gerbaudo, „From Data Analytics to Data Hermeneutics. Online Political 
Discussions, Digital Methods and the Continuing Relevance of Interpretive Approaches“, Digital 
Culture & Society Bd. 2(2), 2016, 112-195 (DOI: 10.14361/dcs-2016-0207); Michael Nerurkar/Timon 
Gärtner, „Datenhermeneutik: Überlegungen zur Interpretierbarkeit von Daten“, in Datafizierung 
und Big Data. Anthropologie — Technikphilosophie — Gesellschaft, hg. von Klaus Wiegerling et al., 
Wiesbaden 2020, 195-209 (DOI: 10.1007/978-3-658-27149-7_8). 

24 Geoffrey Rockwell/Stefan Sinclair, Hermeneutica. Computer-Assisted Interpretation in the Hu- 
manities, Cambridge 2016, 162. 

25 Voyant Tools, in [https:/voyant-tools.org/] (Zugriff: 22.10.2023). 
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dabei, dass gut funktionierende Werkzeuge die Tendenz haben, unsichtbar zu 
werden.”° Derweil, und hier schließen sie an Davis Bairds „Thing Knowledge“” an, 
sind alle diese Werkzeuge von bestimmten Theorien und Vorannahmen geprägt, 
was wiederum die Ergebnisse beeinflusst, die sie produzieren. Sie lenken den Blick 
der Nutzenden und implizieren bestimmte epistemologische und methodische 
Entscheidungen, die es zu reflektieren gilt.”* Sinclair und Rockwell setzen compu- 
tergestützte Werkzeuge nicht der traditionellen Hermeneutik entgegen, sondern 
verknüpfen beide, womit die unterschiedlichen Tools letztlich zu hermeneutischen 
Werkzeugen werden, welche die Nutzenden auf ihre Weise dabei unterstützen, 
Texte zu erschließen und zu verstehen. 

Technische Hilfsmittel zur Unterstützung des Textverständnisses gab es schon 
immer. Schon das Buch ist eine Technologie für das Textverständnis, das im Mit- 
telalter durch weitere Technologien wie Rubrizierungen, Glossen oder Inhaltsver- 
zeichnisse (und selbst Register, s.o.) erweitert wurde. Auch sie verkörpern jeweils 
unterschiedliche Perspektiven und Grundannahmen und beeinflussen so den Zu- 
gang zum Text. In diesem Sinne ersetzt und erweitert der Computer diese beste- 
henden Technologien nur. Anstelle eines Registers bietet er beispielsweise die 
Möglichkeit zur Volltextsuche oder setzt über Textmerkmale wie Satzlänge oder die 
Dichte des verwendeten Vokabulars erste Indikatoren für das Verständnis eines 
Textes, wobei sich der hermeneutische Zugang zu den Texten, z.B. durch die Ein- 
grenzung des Verstehenskontexts bei der Arbeit mit Snippets, ständig ändert. Ganz 
wie Buch und Glossar sind Rechner und Textanalyse am Ende nur weitere her- 
meneutische Instrumente und damit Technologien, die das Textverständnis unter- 
stützen und beeinflussen.” 


5 Der disruptive Moment - vom Zeichen zur 
Bedeutung 


LLM stellen in diesem Rahmen jedoch eine disruptive Entwicklung in Hinblick auf 
unsere hermeneutischen Instrumente dar. Um dies zu verstehen, ist es notwendig 
zu wissen, wie unterschiedlich Computer und Menschen Texte verarbeiten. Denn 
während wir als Menschen die uns präsentierten Zeichen unmittelbar interpre- 
tieren und auf Ebene ihrer - jeweils kontextbezogenen — Bedeutung verarbeiten, 


26 Rockwell/Sinclair 2016, 162. 

27 Davis Baird, Thing Knowledge. A Philosophy of Scientific Instruments, Berkeley 2004. 
28 Rockwell/Sinclair 2016, 150-152, 161-162. 

29 Zum Begriff des hermeneutischen Instruments siehe auch schon Van Zundert 2015. 
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agiert die Maschine allein auf der Ebene der Zeichen. Während wir z.B. bei der 
Zeichenfolge „HOPE“ je nach Kontext an das englische Wort für Hoffnung, an den 
Ort „Hope“ als Geburtsort von Bill Clinton oder aber an den Vornamen von Hope 
Hicks, der ehemaligen Kommunikationschefin von Donald Trump, denken, spei- 
chert und verarbeitet der Rechner diese Zeichenfolge nur als \x48\x4 f\x50\x45 (in 
UTF-8), oder, noch grundlegender, als 1001000100111110100001000101 im Binärcode. 

Unsere bisherigen „hermeneutischen Instrumente“ operierten primär auf der 
Zeichenebene, was rasch zu Problemen und potentiell zu verfälschten oder falschen 
Ergebnissen führen konnte.*° Schon kleine Abweichungen in der Schreibweise, aber 
auch Homonyme oder Synonyme, konnten zu Abweichungen in den Analysen 
führen, was diese weniger präzise machte oder größere Übersetzungsleistungen in 
der Vorbereitung der Analysen erforderte. So konnte schon allein die Nichtbeach- 
tung der Rechtschreibreform Ende der 1990er Jahre zu erheblichen Fehlleistungen 
führen, wenn man in einem Korpus wie Google Books ausschließlich mit der 
Schreibweise „Russland“ nach Belegen für das Sprechen über Russland im Zeitraum 
zwischen 1980 und 2019 suchte und nicht auch die frühere Schreibweise „Rußland“ 
mit einbezog*’. Oder wenn man bei der Analyse des Sprechens über Klima in den 
1990er Jahren besondere Verfahren entwickeln muss, um je nach Kontext die Er- 
wähnung des Klimas als atmosphärischer Zustand vom Sprechen über das politi- 
sche Klima, das Geschäftsklima oder über Viktor Klima, den damaligen Bundes- 
kanzler Österreichs, unterscheiden zu können. 

LLM und Transformer-Modelle scheinen die Begrenzung der Arbeitsweise der 
Maschinen und damit unserer hermeneutischen Instrumente, die bisher allein auf 
die Zeichenebene ausgerichtet waren, auszuhebeln. Interaktionen mit Maschinen 
erfolgen nun verstärkt auf der Grundlage natürlicher Sprache. Tippfehler oder or- 
thografische Variationen verlieren an Relevanz, und Begriffe und Konzepte schei- 
nen nun direkt auf der Bedeutungsebene verarbeitbar, wobei die Maschine die 
verschiedenen Verwendungskontexte von allein unterscheiden kann. Diese Fort- 
schritte könnten den Zugang zu (historischen) Texten und den hermeneutischen 
Prozess ihres Verstehens in Anbetracht der oben genannten Konsequenzen der 
Digitalität ganz grundlegend verändern. 

Dies beginnt schon bei den basalsten Arbeitsschritten, die jedoch viel herme- 
neutische Kompetenz erfordern. Mit unterschiedlichen Formen von Zusammen- 
fassungen, Übersetzungen und direkten Dialogformaten unterstützen Tools wie 


30 Siehe exemplarisch: Torsten Hiltmann et al., „Digital Methods in Practice. The Epistemological 
Implications of Applying Text Re-Use Analysis to the Bloody Accounts of the Conquest of Jerusalem 
(1099)*, Geschichte und Gesellschaft, Bd. 46(1), 2021, 122-56 (DOI: 10.13109/gege.2021.471.122). 

31 In [https://books.google.com/ngrams/] (Zugriff: 22.10.2023). Vgl. Hiltmann 2023, 47-49. 
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Explainpaper,” ChatPDF* oder Elicit** die Forschenden bei der Literaturrecherche 
und -auswertung. Aber wie verlasslich sind diese Verfahren, die zumeist, wie 
ChatGPT, auf GPT (Generative Pre-trained Transformer) aufsetzen, wirklich, und 
was können sie tatsächlich für unser Verständnis von Texten und damit letztlich 
auch für unser Verständnis der Welt leisten? 


6 Experiment: ChatGPT und die Analyse einer 
mittelalterlichen Chronik 


Hierzu ziehen wir ChatGPT mit GPT-4 in der Version vom 25. September 2023 heran 
und bearbeiten damit den Beginn der in Mittelhochdeutsch verfassten „Chronik aus 
Kaiser Sigmund’s Zeit bis 1434, mit Fortsetzung bis 1441“, die im 15. Jahrhundert in 
Nürnberg entstand.” Für das nachfolgende Experiment verwenden wir die ersten 
597 Wörter des Textes, der sprachlich wie strukturell deutlich von unseren heutigen 
Alltagstexten abweicht. Um einen ersten Eindruck zu vermitteln, sei der Anfang 
dieses Textes kurz zitiert: 


Jtem da man zelt 1126 jar do wart Eberach das klofter geltift. Jtem anno domini 1133 jar do wart 
Halfzbrun geftift. Jtem anno domini 1156 jar do wart das hertzogthumb zu Beheim zu einem 
königreich gemacht, und in demfelben jar wart Ofterreich zu einem hertzogthumb gemacht 
aus einer graffchaft. Anno domini 1180 jar do wart hertzog Hainrich von Bayrn vom kaifer 
Friderich mit urthail der furften ent[etzt von [einem hertzogthumb und wart an fein [tatt 
geletzt graff Ott von Sceyren. Jtem anno domini 1200 jar do wart der deutfch orden angehaben 
bey dem babft Jnnocentio dem dritten. ... 


Um den Text zu verstehen, braucht es verschiedene Kompetenzen. Beginnend bei 
entsprechenden Sprachfähigkeiten, über historische Kenntnisse, sowohl ereignis- 
wie auch kulturgeschichtlich, zur inhaltlichen Einordnung sowie das Vermögen, die 
besondere Textstruktur vor dem zeitgenössischen Hintergrund verstehen und 


32 „The Fastest Way to Read Research Papers“, Explainpaper, in [https://www.explainpaper.com/] 
(Zugriff: 22.10.2023). 

33 „Chat with any PDE ChatGPT, in [https://www.chatpdf.com/] (Zugriff: 22.10.2023). 

34 „Analyze research papers at superhuman speed“, Elict, in [https:/elicit.com/] (Zugriff: 22.10. 
2023). 

35 Theodor von Kern (Hg.), „Chronik aus Kaiser Sigmund’s Zeit bis 1434, mit Fortsetzung bis 1441“, in 
Die Chroniken der deutschen Städte von 14. bis in’s 16. Jahrhundert, Bd. 1, Nürnberg — Erster Band, 
Leipzig 1962, 313-414. Als Textdaten veröffentlicht in: Torsten Hiltmann/Carolin Odebrecht, „Corpus 
MasStro - Mittelalterliche Stadtchroniken - Texte, Version 1.0“, Laudatio, 2023, in [wwwlaudatio-repo 
sitory.org/browse/corpus/ZluUPIkBUnBk-z0f73dr/corpora] (Zugriff: 22.10.2023). 
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einordnen zu können. Inwieweit ist ChatGPT daher in der Lage, diesen Text ein- 
zuordnen und Fragen dazu zu beantworten? 


7 Möglichkeiten 


Beginnen wir mit einer Zusammenfassung des hier übergebenen Textes. Dafür 
müsste ChatGPT die inhaltlichen Kernelemente des mittelhochdeutschen Textes 
identifizieren und die verschiedenen Einzelaussagen zu allgemeinen Themen ab- 
strahieren. 


Promptt: 
Fasse den folgenden Text in 3 Sätzen zusammen: [es folgen die ersten 597 Wörter des Textes] 


Antworti: 

Im Mittelalter fanden bedeutende Ereignisse statt: Klosterstiftungen in Eberach (1126) und 
Halszbrun (1133) wurden gegründet. Zwischen den Jahren 1200 und 1333 kam es zu verschie- 
denen politischen und sozialen Entwicklungen, darunter die Bestätigung der Wahlrechte der 
sieben Kurfürsten, die Verfolgung durch einen abtrünnigen Mönch namens Meister Jacob und 
diverse Konflikte zwischen Adeligen. Herzog Ludwig von Bayern spielte eine zentrale Rolle in 
diesen Geschichten, einschließlich seiner Teilung des Landes Bayern und seiner späteren 
Tötung. 


Ganz offensichtlich scheint die Sprache für ChatGPT kein Problem darzustellen. 
Zudem vermag es, den mittelhochdeutschen Text nicht nur zu dekodieren, sondern 
auch inhaltlich zu synthetisieren. Anstatt lediglich Fakten wiederzugeben, scheint 
das Modell die Fähigkeit zu besitzen, den zugrunde liegenden Kontext und die 
Bedeutung der Informationen zu erfassen, wenn es u.a. von „verschiedenen poli- 
tischen und sozialen Entwicklungen“ spricht und Beispiele hierfür nennt. Einzig die 
verschiedenen bayerischen Herzöge mit dem Namen Ludwig werden hier nicht klar 
disambiguiert und damit scheinbar zu einer Person zusammengefasst.”® 

Lassen wir als nächstes ChatGPT den Text einordnen und damit den Rahmen 
für das Verständnis des Textes definieren: 


Prompt2: 
Ordne den Text ein. 


36 Bei dem Getöteten handelt es sich um Ludwig I., den Kelheimer, der 1231 ermordet wurde. Die 
Teilung Bayerns geht hingegen auf Ludwig II. von Bayern, später Oberbayern, zurück, der 1255 (im 
Text jedoch fälschlich unter dem Jahr 1305), und damit nach der Ermordung Ludwigs I., gemeinsam 
mit seinem Bruder Heinrich XII. das Herzogtum Bayern in Ober- und Niederbayern aufteilte. Beide 
erscheinen im Text jedoch stets nur als ,herc3og Ludwig“. 
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Antwort2: 

Der vorliegende Text ist in mittelhochdeutscher Sprache verfasst und bietet einen chronolo- 
gischen Überblick über verschiedene historische Freignisse und Entwicklungen, die zwischen 
den Jahren 1126 und 1333 stattfanden. Der Inhalt konzentriert sich hauptsächlich auf Gebiete 
des Heiligen Römischen Reiches, insbesondere auf Bayern und die damit verbundenen 
Adelshäuser. Es werden sowohl religiöse (z.B. Klosterstiftungen) als auch politische und soziale 
Ereignisse (z.B. Adelskonflikte, Rechte der Kurfürsten) abgedeckt. Der Text gibt Einblick in die 
Machtdynamiken, sozialen Umbrüche und die Interaktionen zwischen wichtigen Persönlich- 
keiten dieser Epoche. 


Die Einordnung präzisiert die vorangehenden Angaben erheblich und hätte durch 
einen Menschen nicht besser umgesetzt werden können. ChatGPT bestimmt Spra- 
che und Genre und ordnet die Inhalte des Textes zeitlich und geographisch korrekt 
ein. Der/die Nutzende erhält damit eine fundierte Einordnung des Textes, noch 
bevor er/sie überhaupt einen Satz des Textes gelesen hat. 

Doch inwiefern kann ChatGPT auch helfen, ambivalente Stellen zu klären, die 
nur auf Grundlage eines breiteren historischen Kontextwissens verstanden werden 
können? Als Beispiel soll hierfür die veraltete Formulierung „übers Meer fahren“ 
dienen, die im Mittelalter oft als Umschreibung für ein Kreuzzugsvorhaben ver- 
wendet wurde. 


Prompt3: 
Was meint: ‚und da kunig Ludwig uber meer wolt faren‘ im Kontext des Textes? 


Antwort3: 

Im vorgelegten Textabschnitt bedeutet der Ausdruck „und da kunig Ludwig uber meer wolt 
faren“ wörtlich, dass König Ludwig beabsichtigte, das Meer zu überqueren oder eine Reise 
über das Meer zu unternehmen. Der spezifische Kontext oder der genaue Grund für Ludwigs 
geplante Meerreise wird aus dem bereitgestellten Textauszug nicht klar. Es könnte eine Pil- 
gerfahrt, eine Handelsmission, eine diplomatische Reise oder ein Kreuzzug sein, je nach his- 
torischem Kontext und den damaligen geopolitischen Umständen. Die Tatsache, dass viele 
Männer versprachen, ihm zu helfen und ihm beizustehen („sy wolten irem herren zu hilf 
kumen“), deutet darauf hin, dass es sich um eine wichtige Unternehmung handelte, die von 
strategischer oder religiöser Bedeutung war. 


ChatGPT bietet in seiner Antwort damit verschiedene Möglichkeiten und trifft noch 
keine Festlegung. Von daher fragen wir noch einmal genauer nach: 


Prompt4: 
Bestimme noch genauer, um was für eine Art von Reise es sich hier handeln könnte. 


Antwort4: 

Basierend auf dem bereitgestellten Text und der Zeitperiode, in der er geschrieben wurde, 
könnte der Ausdruck „und da kunig Ludwig uber meer wolt faren“ auf einen Kreuzzug hin- 
deuten. 
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Die Kreuzzüge waren eine Reihe von religiös motivierten militärischen Expeditionen, die 
hauptsächlich im Mittelalter stattfanden und bei denen christliche Armeen versuchten, das 
Heilige Land und andere Gebiete, die von Muslimen kontrolliert wurden, zurückzuerobern 
oder zu verteidigen. Es war nicht unüblich, dass Könige und Adelige aus dem Heiligen Römi- 
schen Reich an diesen Unternehmungen teilnahmen. 


Die Tatsache, dass im Text viele Menschen versprachen, König Ludwig auf seiner Reise zu 
unterstützen, und die Erwähnung von ,meifter Jacob“, der als eine Art Anführer oder 
Hauptmann agiert, deutet daraufhin, dass es sich um eine groß angelegte Expedition handelte, 
was typisch für Kreuzzüge war. 


Ohne weitere Details oder Kontext ist es jedoch schwer, mit absoluter Sicherheit zu sagen, ob es 
sich tatsächlich um einen Kreuzzug handelte oder um eine andere Art von Expedition. 


Die zweite Antwort ist nun deutlich ausführlicher und argumentiert auf Basis eines 
historischen Kontextwissens, das so nicht Teil des übergebenen Textes ist, sowie 
unter zeitlicher und räumlicher Einordnung der Quelle. Bemerkenswert ist darüber 
hinaus, dass auch der genaue Ort des Ausdrucks im Text identifiziert und daraufhin 
auch der textliche Kontext der Belegstelle in die Argumentation einbezogen wird, 
indem die Interpretation als Kreuzzug u.a. mit der der Belegstelle nachfolgenden 
Aussage begründet wird. 

Dies leitet zur finalen Frage über: Ist ChatGPT auch in der Lage, den Wert eines 
Textes als historische Quelle zu evaluieren, indem es einzelne Aussagen identifiziert 
und eine zufällige Auswahl dieser Aussagen auf deren Korrektheit hin prüft? 


Prompts: 

Bestimme den Quellenwert des Textes. Nimm 3 zufallig ausgewahlte Aussagen und priife diese 
auf Richtigkeit. Es ist wichtig, dass Deine Aussagen korrekt sind. Uberpriife Sie daher immer 
noch einmal. 


Antworts: 
Um den Quellenwert eines historischen Textes zu bestimmen, müssen verschiedene Kriterien 
wie Authentizität, Kontext, Tendenz und Aktualität berücksichtigt werden. Ich werde drei 
zufällig ausgewählte Aussagen aus dem bereitgestellten Text prüfen, um ihre Richtigkeit zu 
bewerten: 


1. Aussage: Im Jahr 1126 wurde das Kloster Eberach gegründet. 

2. Aussage: Anno Domini 1156 wurde das Herzogtum Österreich aus einer Grafschaft gemacht. 
3. Aussage: Anno Domini 1200 wurde der Deutsche Orden vom Papst Innozenz III. anerkannt. 
Überprüfung: 


1. Eberach: Mein aktuelles Wissen reicht nicht aus, um die spezifische Gründung des Klosters 
Eberach im Jahr 1126 zu bestätigen. Es gibt jedoch das Kloster Eberbach im Rheingau, welches 
in den 1130er Jahren gegründet wurde. Es ist möglich, dass es hier zu einer geringfügigen 
zeitlichen Abweichung oder einer Namensverwechslung kommt. 
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2. Herzogtum Osterreich: Das stimmt. Das Herzogtum Osterreich wurde 1156 durch die Pri- 
vilegium Minus aus der Markgrafschaft Osterreich erhoben. Das Privilegium Minus wurde von 
Kaiser Friedrich I. Barbarossa zugunsten von Heinrich II. Jasomirgott, dem Markgrafen von 
Osterreich, ausgestellt. 


3. Deutscher Orden: Das ist korrekt. Der Deutsche Orden, auch bekannt als der Orden der 
Brüder vom Deutschen Haus St. Mariens in Jerusalem, wurde 1190 während des Dritten 
Kreuzzugs gegründet. Papst Innozenz III. bestätigte und erweiterte die Regel des Ordens im 
Jahr 1198, was mit der oben genannten Aussage übereinstimmt. 


Fazit: Basierend auf dieser kleinen Stichprobe scheint der Text zumindest in einigen Punkten 
genaue Informationen zu enthalten. Dennoch wäre es wichtig, bei einer eingehenden Analyse 
des gesamten Textes weitere Informationen und Aussagen zu prüfen und diese mit anderen 
historischen Quellen abzugleichen, um den vollen Quellenwert zu ermitteln. 


Diese Antwort ist in mehrfacher Hinsicht interessant, beginnend mit der Feststel- 
lung, dass sie die Fragestellung präzisiert und den Text als historischen Text ein- 
ordnet. Mit Authentizität, Kontext und Tendenz sind zudem wichtige Schlagwörter 
der historischen Quellenkritik genannt. Tatsächlich umgesetzt wird dann aber, dem 
Prompt entsprechend, nur die Überprüfung der Korrektheit einzelner Aussagen, 
wozu tatsächlich einzelne Aussagen identifiziert und aufihre inhaltliche Richtigkeit 
hin kontrolliert werden. 

Aussage 1 wird zwar methodisch, aber nicht inhaltlich korrekt bewertet, wobei 
der hier unterlaufene Fehler auch für einen menschlichen Bearbeiter sehr nahe- 
liegend wäre. ChatGPT verbessert den im mittelhochdeutschen Text genannten 
Ortsnamen „Eberach“ zu „Eberbach“ und sucht auf dieser Grundlage nach einem 
möglichen Kandidaten, um die Aussage zur Gründung im Jahr 1126 zu überprüfen. 
Tatsächlich bezieht sich der Text an dieser Stelle aber auf das Kloster „Ebrach“, das 
1127 von fränkischen Edelfreien zwischen Bamberg und Würzburg gegründet 
wurde.” Aussage 2 wird korrekt eingeordnet, unter explizitem Bezug auf die für die 
Erhebung Österreichs zum Herzogtum zentrale kaiserliche Urkunde, das Privile- 
gium Minus, auch wenn diese in der Quelle selbst nicht genannt wird. Und auch 
Aussage 3 wird, ebenfalls unter Hinzuziehung weiterer Informationen, korrekt 
bewertet.”® 

ChatGPT scheint somit fähig zu sein, den vorgelegten Text und seine Inhalte 
weitgehend korrekt zu interpretieren und zu bewerten. Aber ist es wirklich in der 
Position, tiefgreifend interpretative und kontextualisierende historische Aufgaben 
zu leisten (und damit die historische Forschung zu revolutionieren)? Das Problem 


37 Siehe von Kern 1962, 344; Vgl. auch Alfred Wendehorst, „Ebrach“, Lexikon des Mittelalters, 
Stuttgart 1977-1999, Bd. 3, col. 1530, in Brepolis Medieval Encyclopaedias - Lexikon des Mittelalters, in 
[https:/www.brepolis.net] (Zugriff: 22.10.2023). 

38 Siehe auch für Aussage 2 und 3 die entsprechenden Einträge im Lexikon des Mittelalters. 
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mit der Identifikation von Herzog Ludwig von Bayern in der Antwort auf Prompti 
mag hier schon Zweifel säen. 


8 Grenzen 


Eine weitere Abfrage bestätigt diese Vorsicht. In der Chronik heißt es, dass im Jahr 
1289 (korrekt wäre 1290) bei einem Turnier in Nürnberg des „herczog Ludwigs sun 
mit einem sper“ von einem Mitglied der Familie von Schellingen getötet wurde. Bei 
einer weiteren Befragung bezüglich der genaueren Identität des betroffenen Sohnes 
Ludwigs weist das Ergebnis von ChatGPT signifikante Einschränkungen auf, welche 
die zuvor wahrgenommene Effektivität des Modells relativieren. 


Prompt6: 
Wer war der Sohn des Herzog Ludwigs, der in dem Rennen erstochen wurde? 


Antwort6: 

Der Text gibt nicht den genauen Namen des Sohnes von Herzog Ludwig an, der während des 
Rennens in Nürnberg erstochen wurde. Es wird lediglich auf „hertzog Ludwigs fun“ (Herzog 
Ludwigs Sohn) Bezug genommen. Ohne weitere Informationen oder Kontext ist es schwierig zu 
bestimmen, welcher Herzog Ludwig gemeint ist und dementsprechend, wer sein Sohn war. Das 
mittelalterliche Europa hatte mehrere Herzöge mit dem Namen Ludwig, und es müssten zu- 
sätzliche Quellen oder spezifischere Informationen konsultiert werden, um diese Frage defi- 
nitiv zu beantworten. 


Da diese Antwort noch unbefriedigend ist, fragen wir zunächst einmal nach dem 
Vater des im Turnier getöteten Sohnes. 


Prompt?: 
Um welchen Herzog Ludwig könnte es sich dem Kontext des Textes nach gehandelt haben? 


Antwort7: 

Der Text enthalt mehrere Hinweise auf Ereignisse, die im Zusammenhang mit bestimmten 
Herzögen und ihrer Zeitperiode stehen. Hier sind einige der Hinweise, die uns bei der Iden- 
tifizierung des betreffenden Herzog Ludwig helfen können: 


1. Zeitliche Einordnung: Die Erwähnung des Todes von ,,“hert3og Ludwigs fun“ findet im Jahr 
„1200 und in dem 89 jar“ statt, was bedeutet, dass das Ereignis im Jahr 1289 stattfand. 


2. Regionale Einordnung: Viele der im Text genannten Ereignisse beziehen sich auf Bayern 
oder umliegende Gebiete (wie beispielsweise Österreich). Das lässt darauf schließen, dass es 
sich möglicherweise um einen Herzog aus dieser Region handelt. 


Mit diesen Informationen können wir spekulieren, dass es sich bei „Herzog Ludwig“ um 
Ludwig IL, den Strengen, Herzog von Bayern und Pfalzgraf bei Rhein handeln könnte. Ludwig 
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II. regierte in der zweiten Hälfte des 13. Jahrhunderts, was zeitlich mit dem im Text genannten 
Jahr 1289 übereinstimmt. 


Sein Sohn, Ludwig III., auch als Ludwig der Jüngere bekannt, könnte derjenige sein, der im Text 
erwähnt wird und 1289 bei einem Turnier in Nürnberg ums Leben kam. 


Es ist jedoch wichtig zu beachten, dass eine endgültige Identifizierung ohne weitere spezifische 
Informationen oder zusätzliche Quellen unsicher ist. Historische Daten sollten immer mit 
Vorsicht und im Kontext anderer verlässlicher Quellen interpretiert werden. 


Bemerkenswert an dieser Antwort ist zunächst das klare methodische Vorgehen bei 
der Identifizierung möglicher Kandidaten für den Begriff „hertzog Ludwigs“. Und 
tatsächlich handelt es sich bei dem Herzog, der 1289 bei einem Turnier in Nürnberg 
seinen Sohn verlor, um Ludwig IL, den Strengen. Noch bemerkenswerter ist, dass 
die gegebene Antwort die Frage in den Kontext des Chatverlaufs stellt und auf 
Grundlage dieser neuen Information die weiter oben, jedoch nicht hier gestellte 
Fragen nach der Identität des verstorbenen Sohns zu beantworten sucht. Aber ab 
hier passen dann auch die inhaltlichen Aussagen nicht mehr. Der für diese Zeit in 
Frage kommende Ludwig III. (1290-1296) verstarb erst einige Jahre nach dem 
Turnier und wurde auch nicht „Ludwig der Jüngere“ genannt.” Vor allem aber war 
er nicht der Sohn Ludwigs II. von Oberbayern, sondern Heinrichs XIII. von Nie- 
derbayern. 

Das Herausarbeiten der konkreten Identitäten wird noch komplizierter, wenn 
man nach den Söhnen Ludwigs II. fragt, um den Kreis der möglichen Opfer weiter 
einzugrenzen: 


Prompts: 
Welche Söhne hatte Herzog Ludwig II., der Strenge? 


Antwort8: 
Ludwig IL, der Strenge, Herzog von Bayern und Pfalzgraf bei Rhein, hatte mehrere Kinder. Von 
seinen Söhnen sind besonders bekannt: 


1. Rudolf I. von Bayern: Er wurde Herzog von Oberbayern und Pfalzgraf bei Rhein. 


2. Ludwig IV., der Bayer: Er wurde ein sehr bedeutender Herrscher und später römisch- 
deutscher König und Kaiser des Heiligen Römischen Reiches. 


3. Stephan I.: Er wurde Herzog von Niederbayern. 


Da der im Text erwähnte Sohn von Herzog Ludwig bei einem Turnier in Nürnberg ums Leben 
kam, könnte es sich um einen dieser Söhne handeln. Allerdings ist Ludwig IV., der Bayer, als 


39 Tatsächlich gab es auch einen bekannten bayerischen Herrscher, der „Ludwig der Jüngere“ ge- 
nannt wurde. Dies war jedoch der ostfränkische König Ludwig III. (835-882), der auch König von 
Bayern war und mehr als 400 Jahre früher lebte. 
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späterer Kaiser des Heiligen Römischen Reiches, eine sehr bekannte Figur in der Geschichte, 
und es ist unwahrscheinlich, dass sein Tod auf diese Weise unkommentiert bleiben würde. Das 
lässt Rudolf I. oder Stephan I. als wahrscheinlichere Kandidaten erscheinen. Es ist jedoch 
wichtig, weitere Quellen zu konsultieren, um die genaue Identität des im Text erwähnten 
Sohnes zu klären. 


Als die bekanntesten Söhne werden hier Rudolf I., Ludwig IV. der Bayer und Stephan 
I. genannt. Der spätere Kaiser Ludwig IV. wird hier korrekterweise ausgeschlossen, 
dafür aber Rudolf I. und Stephan I. als mögliche Kandidaten für den im Turnier 
verstorbenen Sohn ins Spiel gebracht. Rudolf I. war tatsächlich Sohn Ludwigs II. 
und ab 1294 auch dessen Nachfolger. Stephan I. hingegen, wie schon Ludwig IIL, war 
nicht Sohn Ludwigs II. von Oberbayern, sondern Heinrichs XII. von Niederbayern. 
Fragt man ChatGPT nun noch nach weiteren Söhnen Ludwigs II., erhält man zudem 
die Namen: 


Otto IIL: Er wurde Herzog von Niederbayern. 
Heinrich XIII.: Er wurde ebenfalls Herzog von Niederbayern. 


Heinrich XIII. von Niederbayern kennen wir bereits; Otto III. war sein Sohn. Bei dem 
im Turnier verstorbenen Sohn handelt es sich derweil um Ludwig Elegans, den 
ältesten Sohn Ludwigs II. aus erster Ehe. Über ihn ist über den frühen Turniertod 
hinaus, der sich tatsächlich 1290 ereignete, nichts weiter bekannt.” 

Während ChatGPT damit einerseits fähig ist, unbekannte Texte korrekt einzu- 
ordnen und schwierige Stellen vor einem großen Informationshintergrund auch 
argumentativ einzuordnen und zu beleuchten, scheitert es offensichtlich an den 
komplexen Namens- und Herrschaftsverhältnissen im Bayern des 13. Jahrhunderts. 

Wie lassen sich diese unterschiedlichen Ergebnisse erklären? Um nun genauer 
einschätzen zu können, über welche Fähigkeiten ChatGPT tatsächlich verfügt und 
über welche nicht, und damit auch entscheiden zu können, in welcher Weise 
ChatGPT und LLM als hermeneutische Instrumente in den Arbeits- und Verste- 
hensprozess der Geschichtswissenschaften integrierbar sind, ist es unerlässlich, 
zunächst die Technologien und Methoden besser zu verstehen, auf deren Grundlage 
ChatGPT funktioniert. Denn wie überall im Umgang mit neuen computationellen 
Methoden gilt auch hier: Erst wenn wir Methode und Technologie verstanden ha- 
ben, können wir diese auch reflektiert und verantwortungsvoll nutzen. 


40 „Ludwig, Indexeintrag“, Deutsche Biographie, in [www.deutsche-biographie.de/pnd13795638X. 
html] (Zugriff: 22.10.2023). 
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9 Technologische und methodische Hintergründe 


Um die Prozesse, die zu den Ergebnissen des Experiments geführt haben, genauer 
zu verstehen, ist es entscheidend, sich mit drei zentralen Schlüsselkonzepten aus- 
einanderzusetzen: den Embeddings, der Self-Attention und den Transformer-Mo- 
dellen selbst. 


9.1 Embeddings - Wie die „Bedeutung“ in das Modell kommt 


Embeddings sind eine Methode zur Umwandlung von Wörtern in Vektoren von 
Zahlen und damit in große Zahlenreihen, wobei Wörter, die in ähnlichen Kontexten 
vorkommen, ähnliche Vektoren haben. Ein bekannter Ansatz ist Word2Vec, der ein 
„Moving Window“ verwendet, um die Kontextwörter eines jeden Worts zu erfas- 
sen.” Dafür geht ein Algorithmus in den Texten der Reihe nach jedes Wort durch 
und erfasst, wie häufig welche Wörter innerhalb eines bestimmten Abstands dieses 
Wort begleiten. Diese Kontextwörter werden dann zu spezifischen Vektoren für 
jedes Wort zusammengefasst. Durch das Training an umfangreichen Textdaten 
erstellt Word2Vec damit ein statistisches Modell für den in den Daten gefundenen 
Gebrauch der Wörter (welche Wörter häufiger und welche seltener oder gar nicht 
im Kontext eines jeden einzelnen Wortes auftauchen) und damit ein statistisches 
Modell für Wortkontexte. Ähnliche Gebrauchskontexte ergeben dabei ähnliche 
Vektoren, womit Homonyme in ihrer Bedeutung unterschieden und auch Synony- 
me erkannt werden können, da sie in den gleichen Kontexten vorkommen. Im 
Vektorraum des Modells bilden sich damit semantische Beziehungen als räumliche 
Distanzen ab. Begriffe wie „männlich“, „weiblich“, „König“ und „Königin“ bei- 
spielsweise haben dann ähnliche Abstände zueinander, was Rückschlüsse auf ihre 
Bedeutungen zulässt (siehe Abb. 1). 


41 Zu Embeddings allgemein siehe Daniel Jurafsky/James H. Martin, Speech and Language Pro- 
cessing, 2023, Kap. 6: „Vector Semantics and Embeddings‘ in [https://web.stanford.edu/~jurafsky/slp3/ 
6.pdf] (Zugriff: 22.10.2023). Zu Word2Vec im Besonderen siehe: Tomas Mikolov et al., Efficient 
estimation of word representations in vector space, ArXiv 2013 (arXiv: 1301.3781) sowie für die 
Auswertbarkeit der Vektoren Tomas Mikolov et al., „Distributed Representations of Words and 
Phrases and their Compositionality“, Neural Information Processing Systems, ArXiv 2013 (arXiv: 
1301.3781). 
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Abbildung 1: Schematische Darstellung der Beziehung zwischen Wörtern in einem auf zwei Dimen- 
sionen reduzierten Vektorraum.” 


Damit ist es möglich, nicht mehr nur auf der Zeichenebene der in den Texten 
verwendeten Begriffe zu operieren, sondern auf einer scheinbaren Bedeutungs- 
ebene. Diese ergibt sich jedoch ausschließlich aus dem statistischen Modell des 
Gebrauchs der jeweiligen Begriffe bzw. Buchstabenfolgen in den Trainingsdaten. 
Die Bedeutung der einzelnen Buchstabenfolgen (Zeichenebene) wird damit nicht 
explizit kodiert, sondern implizit aus den verwendeten Textdaten abgeleitet. Das so 
entstandene Modell stellt damit auch kein Modell der Welt dar, sondern nur ein 
Modell der Sprache, die über die Welt spricht. 

Dies wird insbesondere klar, wenn man berücksichtigt, dass das GPT-Sprach- 
modell nicht auf vollständigen Wörtern, sondern auf Wortteilen, also unter- 
schiedlich langen Buchstabensequenzen, basiert. Anstatt z.B. die Gebrauchskon- 
texte für den Begriff „Hermeneutik“ auf Basis der Zeichenkette „Hermeneutik“ zu 
erstellen, zerlegt GPT diese in Elemente (Token) wie „H“, „er“, „men“, „eut“, „ik“ und 
generiert daraus einen Vektorraum. 

Für das Training großer Sprachmodelle können diese Embeddings zusätzlich 
für jeden einzelnen Satz als Sentence Embeddings zusammengefasst werden, um 
die Modellierung des jeweiligen Sprachgebrauchs auch auf Satzebene zu verbes- 
sern. 

Wichtig für die Einordnung des disruptiven Charakters von LLM ist damit: 
Auch LLM operieren zunächst einmal auf der Zeichenebene, erweitern diese jedoch 


42 In [wwwsamyzaf.com/ML/nlp/word2vec2.png] (Zugriff: 22.10.2023). 
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mit statistischen Modellen der Verwendung dieser Zeichen, woraus dann eine be- 
stimmte Form von Bedeutung zu entstehen scheint. 


9.2 Self-Attention - Wie der Kontext in das Modell kommt 


Nachdem die einzelnen Worter mittels Embeddings in vektorisierte Formen ihrer 
Bedeutung überführt wurden, tritt bei Modellen, die wie GPT auf der Transformer- 
Architektur basieren, ein weiterer entscheidender Mechanismus in Kraft: die Self- 
Attention.” Dieser setzt die im Eingabetext verwendeten Wörter bzw. Zeichense- 
quenzen in den Kontext des gesamten Textes und bietet so einen verfeinerten Zu- 
sammenhang für jedes einzelne Wort. Anders als ältere Technologien, die Texte nur 
in kleinen Teilstücken nacheinander bearbeiten konnten, ermöglicht die Self-At- 
tention-Struktur, bis zu einer bestimmten maximalen Sequenzlänge den gesamten 
Text auf einmal zu verarbeiten. Damit wird für jedes Wort im Eingabetext nicht nur 
seine eigene Bedeutung (Embedding), sondern auch sein Verhältnis zu allen an- 
deren Wörtern im jeweiligen Eingabetext berücksichtigt. 

Die Self-Attention nutzt dabei mehrere „Heads“,** die unterschiedliche Aspekte 
der Beziehungen zwischen den Wörtern eines Textes berücksichtigen, ohne dass sie 
explizit darauf programmiert bzw. trainiert wurden. Die unterschiedlichen Spe- 
zialisierung der „Heads“ auf bestimmte Aspekte der Beziehungen zwischen den 
Wörtern bzw. Zeichenfolgen in den Textdaten haben sich vielmehr erst im Rahmen 
des Trainings herausgebildet. Dabei kann z.B. der eine „Head“ dazu neigen, syn- 
taktische Beziehungen wie die zwischen einem Subjekt und seinem Prädikat zu 
erkennen (siehe Abb. 2). Ein anderer wiederum spezialisiert sich darauf, korefe- 
rentielle Beziehungen wie die zwischen einem Pronomen (,er“, „sie“) und dem 
zugehörigen Nomen zu identifizieren. Während das erste publizierte Transformer- 
Modell nur acht dieser Heads beinhaltete, verfügt das größte der GPT-3-Modelle über 
96 Heads in 96 verschiedenen Layern.*° 


43 Siehe grundlegend Ashish Vaswani et al., Attention Is All You Need, ArXiv 2017 (arXiv: 1706.03762). 
44 Zur Funktionsweise vgl. Christopher D. Manning et al., ,Emergent linguistic structure in artificial 
neural networks trained by self-supervision“, Proceedings of the National Academy of Sciences, 
Bd. 117, 2020, 30046-30054 (DOI: 10.1073/pnas.1907367117), sowie Kevin Clark et al., „What does BERT 
look at? An analysis of BERT’s attention“, Proceedings of the Second BlackboxNLP Workshop on 
Analyzing and Interpreting Neural Networks for NLP, hg. von Tal Linzen et al., Stroudsburg PA 2019, 
276-286 (arXiv:1906.04341). 

45 Tom B. Brown et al., Language Models are Few-Shot Learners, ArXiv 2020 (arXiv:2005.14165). 
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Abbildung 2: Beispiel für die Aufmerksamkeit eines Attention Heads.“ 


Ausgehend von der in den Embeddings codierten Bedeutung der einzelnen Zeic- 
henfolgen wird durch den Self-Attention-Mechanismus damit ein scheinbar tiefes 
„Verständnis“ für deren spezifische Verwendung im Kontext des gegebenen Ein- 
gabetextes hergestellt. Entsprechend kann bei der Beantwortung von Fragen so- 
wohl der engere Kontext eines bestimmten Textabschnitts als auch der Gesamt- 
kontext des übergebenen Textes berücksichtigt werden. Und auf die gleiche Weise 
kann in einem Prompt auch zwischen einer Anweisung und dem übergebenen Text 
unterschieden werden. 


9.3 Transformer und Training - Wie die Texte und Dialoge 
entstehen 


Das Hauptziel von Transformer-Modellen schließlich besteht darin, auf Grundlage 
ihres antrainierten Modells eine Texteingabe zu „interpretieren“, um daraufhin 
einen passenden Ausgabetext zu generieren.“ Dies kann eine Übersetzung sein, die 
Zusammenfassung oder Erweiterung eines gegebenen Textes, oder auch die Be- 


46 Clark et al. 2019, 5. 

47 Vgl. grundlegend Vaswani 2017. Für eine einfache Einführung in Transformer-Modelle, vgl. Jay 
Alammar, The Illustrated Transformer, Blog-Post, 2018, in [https://jalammargithub.io/illustrated-trans 
former/] (Zugriff: 22.10.2023). 
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antwortung einer in der Eingabe gestellten Frage. Aktuelle Transformer-Modelle 
besitzen die Fähigkeit, auf eine Vielzahl von Anweisungen unter Berücksichtigung 
des jeweils gegebenen Kontexts reagieren zu können. Dass dies möglich ist, liegt an 
ihrer besonderen Architektur und an der Art und Weise, wie sie trainiert wurden. 
Vor allem aber liegt es an der Menge der trainierbaren Parameter und der Trai- 
ningsdaten. 

Wenn hier von Textgenerierung gesprochen wird, bedeutet dies für Modelle 
wie GPT im Wesentlichen, für eine gegebene Wortsequenz das wahrscheinlichste 
nächste Wort vorherzusagen. Der Text wird damit rein sequentiell, also Wort für 
Wort bzw. Token für Token, generiert. Dies ermöglicht es dem Modell, sowohl auf 
den Eingabetext als auch auf den bereits generierten Text zu reagieren. Dabei bilden 
in Chat-Applikationen wie ChatGPT die Dialoge aus Prompts (einschließlich der 
übergebenen Texte etc.) und den automatisiert generierten Antworten am Ende 
eine zusammenhängende Texteinheit. Das erklärt, warum ChatGPT innerhalb einer 
Konversation kontinuierlich im Kontext des bisherigen Gesprächs antwortet und 
sich im Verlauf des Dialogs stetig verbessern kann. 

Aufbauend auf den Embeddings der Eingabetexte, verschiedener Schichten von 
Self-Attention-Mechanismen und weiteren trainierbaren Elementen, können text- 
generierende Transformer-Modelle für einen gegebenen Text Vorhersagen für das 
nächste Wort treffen.”” Frühere Modelle mussten dafür zunächst in einem Pre- 
training mit einer großen Menge von Textdaten trainiert werden, um zentrale 
Merkmale der Texte bzw. der darin verwendeten Sprache zu erlernen, die dann in 
den verschiedenen trainierbaren Gewichten der Attention Heads und der Netz- 
werkschichten abgebildet sind. Um ein solches Modell dann aber tatsächlich für 
eine spezifische Aufgabe nutzen zu können, musste es daraufhin noch einmal mit 
einer großen Menge von Input-Output-Beispielen, wie Übersetzungen oder Kom- 
binationen aus Text und Abstract oder Frage und Antwort, für diesen Zweck opti- 
miert werden. Für unterschiedliche Anwendungen mussten daher oft verschiedene 
Modelle trainiert werden. 

Mit der Einführung von GPT3 änderte sich dieser Ansatz. Hier wurde die An- 
nahme verfolgt, dass besonders große Modelle, die mit besonders umfangreichen 
Datenmengen trainiert werden, effizienter arbeiten und weniger Fine-Tuning be- 
nötigen. Dementsprechend wurden die Architektur und die Trainingsdaten ange- 
passt. Das größte und leistungsfähigste Modell von GPT-3 besteht daher aus 96 
Schichten, die jeweils über 96 Attention-Heads verfügen (zusammen 9216), und 
kommt auf insgesamt 175 Milliarden trainierbare Parameter. Als Trainingsdaten für 
das Sprachmodell diente ein Korpus aus 45 TB Textdaten, basierend auf riesigen 


48 Siehe Brown et al. 2020. 
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Internettextkorpora (Common Crawl und WebText2), Daten aus zwei nicht näher 
spezifizierten internetbasierten Buchkorpora sowie der englischsprachigen Wi- 
kipedia.” 

Im Ergebnis konnte GPT3 verschiedene Aufgaben nun ganz ohne aufwändiges 
Fine-Tuning durch sogenanntes Zero-, One- oder Few-Shot Learning erfüllen. Das 
heißt, dass es in der Lage ist, korrekt auf Anweisungen in Prompts zu reagieren, 
selbst wenn es nie speziell dafür trainiert wurde. Dabei verbesserten sich die Er- 
gebnisse noch, wenn im Prompt Beispiele für das gewünschte Verhalten mit an- 
gegeben wurden (In-Context-Learning).°° 

Auf diese Weise konnte das Modell beispielsweise, so wie es war, den Prompt 
„Iranslate English to French: Cheese =>“ korrekt mit „fromage“ und „Alice was 
friends with Bob. Alice went to visit her friend“ mit „Bob“ ergänzen oder Artikel 
schreiben, die von jenen menschlicher Autor:innen kaum mehr zu unterscheiden 
sind. Gleiches gilt für Q&A-Aufgaben, bei denen GPT3 die Leistung früherer Modelle 
meist deutlich übertraf. Dies gilt jedoch nicht für alle Tests. Gerade da, wo es um 
sehr granulares Wissen aus der Wikipedia ging, schnitt die GPT3 deutlich schlechter 
ab.°' Denn das besonders große Sprachmodell kann, so ist zu mutmaßen, zwar 
immer wieder in den Trainingsdaten wiederholte allgemeine Informationen gut 
reproduzieren, aber nicht solche, die eher kleinteilig und selten sind. 

Die zugrundeliegende Funktionsweise von GPT3 lässt sich besonders an- 
schaulich am Beispiel der Lösung von Additions- und Substraktionsaufgaben auf- 
zeigen: 

In einem Test mit unterschiedlich großen GPT3-Modellen erzielte das größte 
Modell zwar die besten Ergebnisse. Allerdings variierten auch hier die Resultate 
abhängig von der jeweiligen Aufgabenstellung. So lag das Ergebnis bei der Addition 
und Substraktion im Few-Shot-Setting (also mit einigen Beispielen im Prompt) bei 
zweistelligen Zahlen bei 100 % bzw. bei 98.9 %. Bei dreistelligen Zahlen dann jedoch 
bei 80.2 % und 94.2 % und bei vierstelligen nur noch bei 25-26 %. Bei fünfstelligen 
Zahlen schließlich wurden nur noch 9 bzw. 10 % der Aufgaben richtig gelöst. Im 
Zero-Shot-Verfahren, also ohne beigegebene Beispiele, lag GPT-3 bei der Addition 
zweistelliger Zahlen nur zu 769 % und bei dreistelligen Zahlen nur zu 34.2 % 
richtig.” 

Wie lässt sich das erklären? Zum einen konnte das Modell im Few-Shot-Setting 
mit den Beispielen im Prompt ein Muster aufnehmen, auf dessen Grundlage es 
bessere Ergebnisse finden konnte. Vor allem aber basiert GPT3 allein auf einem 


49 Ebd., 8. 
50 Ebd., 4. 
51 Ebd., 13-14. 
52 Ebd., 21-23. 
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statistischen Modell seiner Trainingsdaten, nicht jedoch auf einem Modell arith- 
metischer Logik. Entsprechend sind korrekte Beispiele mit zweistelligen Zahlen als 
Antwortvorlage deutlich wahrscheinlicher als solche mit fünfstelligen Zahlen. Ein 
Umstand, der sich auch im Playground von OpenAl sehr einfach reproduzieren 
lässt, wo man zugleich auch die Wahrscheinlichkeiten für die verschiedenen an- 
gebotenen Antwortoptionen anzeigen lassen kann.” Auch das beste Modell text- 
davinci-003°* bietet bei der Gleichung 2+2 das Ergebnis 4 nur mit einer Wahr- 
scheinlichkeit von 56%, das Ergebnis 5 noch bei 10.4%. Bei dem Modell für ChatGPT- 
35 (gpt-3.5-turbo-instruct) liegt die Wahrscheinlichkeit nur noch bei 46%. 

Das mit 1,8 Billionen Parametern in 120 Schichten noch einmal erheblich grö- 
Bere Modell von GPT-4,°° über dessen Training und Architektur von OpenAl leider 
nur wenig bis nichts veröffentlicht wurde, bietet in vielen Belangen eine noch 
deutlich bessere Performanz, gerade auch bei logischen Inferenzaufgaben, wenn- 
gleich für die meisten Tests noch nicht auf dem Niveau, das Menschen im Durch- 
schnitt erreichen (wobei GPT-4 deutlich besser abschneidet als ChatGPT). Analog zu 
den hohen Zahlen lässt auch hier die Leistung von GPT-4 deutlich nach, wenn es um 
neue bzw. unbekannte Datensätze geht und damit um Beispiele, die nicht in den 
Trainingsdaten zu finden sind.°® 

Tatsächlich hat die Zusammensetzung der Trainingsdaten wohl einen gewissen 
Einfluss auf die Ergebnisse. Entweder durch deren Fehlen, wie eben gezeigt. Oder 
aber durch deren Präsenz. Denn Informationen oder Muster, die sehr wahr- 
scheinlich Teil der Trainingsdaten waren, scheinen auf der anderen Seite die 
Qualität der Antworten zu verbessern. Dies konnte gezeigt werden, indem man 
ChatGPT/GPT-4 Passagen aus bekannten Büchern übergab, jedoch die Eigennamen 
im Text maskierte, die es dann richtig erriet.°’ Auch Fragen über diese Texte, wie 
z.B. das Publikationsjahr, waren dann signifikant genauer beantwortet als bei an- 
deren Texten. Dabei mutmaßen die Autoren, dass dieser Memorizing-Effekt dort 
noch höher ist, wo Texte möglicherweise gleich mehrfach in den Trainingsdaten 


53 Open AI, in [https:/tip.de/ufdoz] (Zugriff: 22.10.2023), mit den Parametern „show probabilities in 
Full spectrum“, und „Temperature = 0“. 

54 Für die verschiedenen GPT-Modelle und deren Eigenschaften vgl. in [https://platform.openai. 
com/docs/models/gpt3-5] (Zugriff: 22.10.2023). 

55 OpenAl, GPT-4 Technical Report, ArXiv 2023 (arXiv:2303.08774). 

56 Vgl. Hanmeng Liu et al., Evaluating the Logical Reasoning Ability of ChatGPT and GPT-4, ArXiv 
2023, 6 (arXiv:2304.03439), sowie den Diskussionsbeitrag von Konstantine Arkoudas, GPT-4 Can’t 
Reason, ArXiv 2023 (arXiv:2308.03762). 

57 Vgl. Kent K. Chang et al., Speak, Memory. An Archaeology of Books Known to ChatGPT/GPT-4, 
ArXiv 2023 (arXiv:2305.00118). 
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vorkommen.’ Erste eigene Tests zeigen derweil, dass dies unter GPT-4 auch für 
deutschsprachige Texte funktioniert, wenn z.B. in einem Auszug aus den „Leiden 
des jungen Werther“ die betreffende Leerstelle korrekt mit „Lotte“ gefüllt wird, statt 
mit „Charlotte“, wie Lotte in den englischen Übersetzungen heift.°° 

Auch diese sehr großen Sprachmodelle lassen sich durch Fine-Tuning für 
spezifische Aufgaben optimieren, so wie es bei ChatGPT der Fall ist. ChatGPT ist eine 
besondere Version von GPT, die durch viel menschliches Feedback und ein kom- 
plexes Training an umfangreichen Daten nachtrainiert wurde, um in Dialogen 
zufriedenstellende Antworten zu liefern. Inwieweit dabei auch spezifische Aufga- 
benstellungen optimiert wurden, ist leider nicht öffentlich bekannt. 


10 Erklärung der Ergebnisse 


Auf dieser Grundlage lassen sich die obigen Ergebnisse nun besser interpretieren. 

Zunächst ist die Beherrschung des Mittelhochdeutschen zu diskutieren. Diese 
Fähigkeit könnte darauf zurückgehen, dass GPT-4, dessen Modell für ChatGPT im 
obigen Experiment verwendet wurde, möglicherweise nicht mehr nur mit Trai- 
ningsdaten in englischer Sprache trainiert wurde, sondern in bis zu 26 verschie- 
denen Sprachen.” Es ist gut möglich, dass GPT-4 aus der Kombination der Em- 
beddings und der Self-Attention über die vielen Schichten hinweg ein allgemeines 
Sprachmodell erlernt hat, welches es ermöglicht, auch weniger verbreitete Spra- 
chen wie das Mittelhochdeutsche weitgehend korrekt zu verarbeiten. 

Was ChatGPT in seinen Antworten überraschend gut gelang, war zunächst die 
Zusammenfassung und Einordnung der im Text geschilderten Ereignisse, die hier 
z.T. auch zu allgemeinen Aussagen abstrahiert wurden: „kam es zu verschiedenen 
politischen und sozialen Entwicklungen, darunter die Bestätigung der Wahlrechte 
der sieben Kurfürsten, die Verfolgung durch einen abtrünnigen Mönch namens 
Meister Jacob ...“.°' 

Ähnliches ließ sich auch bei der Einordnung des Begriffs „uber meer wolt fa- 
ren“ beobachten, wo zunächst recht allgemeine Alternativen angeboten wurden 


58 Dies wurde zumindest für vergleichbare Modelle für die Bildgenerierung (u.a. auch DALL-E 2 
von OpenAl) nachgewiesen, vgl. Nicholas Carlini et al., Extracting training data from diffusion mo- 
dels, ArXiv 2023 (arXiv:2301.13188). 

59 Open AI, in [https://tip.de/semxz] (Zugriff: 23.11.2023). 

60 Auch der Technical Report von OpenAl zu GPT-4 macht keine Angaben zu den Trainingsdaten. 
Jedoch ist das neue Modell jetzt deutlich performanter, vgl. OpenAl, GPT-4 Technical Report, 2023, 
7-8. 

61 Siehe oben, Antwortl. 
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und dann auf Nachfrage eine klare Festlegung unter Rückgriff auf den Kontext des 
beigegebenen Textes sowie des erschlossenen zeithistorischen Rahmens dieses 
Textes erfolgte. Während der textliche Kontext sich aus der Self-Attention erklären 
lässt, könnte der historische Kontext auf die Informationen zurückgehen, die aus 
der Vielfalt der Trainingsdaten im Sprachmodell gelernt und hinterlegt wurden. Bei 
der Überprüfung der Fakten scheint das Gleiche zu gelten. Die Ausführung der 
Aufgabe, zufällig drei Aussagen herauszusuchen und diese zu prüfen, mag dabei auf 
die Zero-Shot-Kapazität des Modells zurückgehen. Die Überprüfung selbst basiert 
dann allein auf der Prüfung der Existenz spezifischer Ereignisse, wie z.B. der Er- 
hebung Österreichs zum Herzogtum oder der Bestätigung des Deutschen Ordens 
durch Innozenz III, und deren Datierungen. Dabei werden allgemeine Aussagen 
meist bestätigt und um zusätzliche Kontextinformationen ergänzt, und die Jah- 
resangaben meist als korrekt akzeptiert - obwohl sie, wie bei der Bestätigung des 
Deutschen Ordens durch Innozenz III, auch um ein bis zwei Jahre von den tat- 
sächlichen Daten abweichen. Was diese kontextualisierenden bzw. kontextbe- 
wussten Aussagen gemein haben: Sie verweisen alle auf gut bekannte Ereignisse, 
die in den Trainingsdaten sicherlich immer wieder berichtet werden. 

Was hingegen weniger gut funktionierte, war die Beantwortung der sehr spe- 
zifischen Frage nach dem im Turnier umgekommenen Sohn Heinrichs II. von 
Bayern. Dabei ist davon auszugehen, dass die hierfür notwendigen Informationen 
deutlich seltener in den Trainingsdaten präsent waren, wenn überhaupt. Hier nun 
scheint das Modell zwischen den verschiedenen Herzögen und deren Söhnen, 
zwischen Oberbayern und Niederbayern, durcheinandergekommen zu sein. Viel- 
leicht liegen diese verschiedenen Begriffe im Vektorraum schlicht zu nah beiein- 
ander, um in unterschiedlichen Kombinationen als eigenständige Konzepte bzw. 
Entitäten ansprechbar zu sein. Am Ende sind auch Bayern/Oberbayern/Nieder- 
bayern, Herzog/Ludwig/Heinrich etc. nur Worte bzw. Zeichenketten. Ein symbolisch 
repräsentiertes Konzept für die einzelnen Personen wie für (deren) Verwandt- 
schaftsverhältnisse scheint es im Modell nicht zu geben, weshalb das Modell am 
Ende zwar zu einem sprachlich, jedoch nicht inhaltlich plausiblen Ergebnis kommt. 

Dies wird noch einmal deutlich, wenn man GPT im Playground im Vervoll- 
ständigungsmodus darum bittet, den Satz „Die Söhne von Ludwig II., dem Strengen, 
Herzog von Oberbayern und Pfalzgraf bei Rhein, waren:“ zu vervollständigen. Selbst 
wenn man die Parameter so einstellt, dass stets nur das wahrscheinlichste Ergebnis 
angezeigt wird (Temperatur = 0°”), kommt man zu einem erstaunlichen Ergebnis: 


62 Der Parameter „temperature“ definiert, wie deterministisch der Text generiert wird. Tatsächlich 
führt eine Temperatur größer als 0 dazu, dass in bestimmten Abständen immer wieder auch un- 
wahrscheinliche Kandidaten als nächstes Wort generiert werden, was dann wiederum in den 
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eine Liste von insgesamt 39 Namen, die wahrscheinlich nur wegen der Zeichenli- 
mitierung für die Antwort endet, und mit Ludwig III. und Heinrich XIII. beginnend 
dann eine große Zahl vor allem von Ottos, Rudolfs und Stephans aufzählt mit Le- 
bensdaten, die vom 13. Jahrhundert bis schließlich ins 19. Jahrhundert reichen.™ 


11 Einordnung: Hermeneutik aus der Maschine? 


Was bedeuten diese Ergebnisse nun abschließend für unsere Frage, ob Large 
Language Models wie ChatGPT über eigene hermeneutische Fähigkeiten verfügen 
und ob, und wenn ja, wie man diese Technologien sinnvoll in unseren hermeneu- 
tischen Prozess eingliedern kann? Dies soll im Folgenden aus zwei verschiedenen 
Perspektiven beantwortet werden: zum einen technologisch-methodologisch, wenn 
es darum geht, wie das Modell arbeitet und was das für die Verwendung der damit 
erzeugten Ergebnisse für die Geschichtswissenschaften inhaltlich bedeutet, und 
zum anderen hermeneutisch-epistemologisch, wenn wir danach fragen, wie die 
mögliche Verwendung dieser Technologie auch unser menschliches Verständnis 
und damit als Tool unsere eigene Wissensproduktion beeinflusst. 


11.1 LLM als maschinelle Hermeneutik? 


Es sollte deutlich geworden sein, dass das Modell trotz seiner kontextsensiblen und 
nach außen hin reflektiert erscheinenden Antworten nicht in der Lage ist, den 
Inhalt eines Textes kognitiv zu erfassen oder zu verstehen. Grundsätzlich kann es 
nur Trainingsdaten und darin enthaltene Muster replizieren bzw. auf Grundlage 
der so gelernten Muster Text produzieren. Durch die angewandten Technologien 
wie Embeddings und Self-Attention sowie durch die Größe des Modells und des 
riesigen Trainingskorpus sind die Ergebnisse des Modells sprachlich sehr über- 
zeugend. Doch ordnen sich auch die darin vermittelten Informationen und Inhalte 
dem statistischen Prinzip des Modells unter. Auch sie werden auf Grundlage sta- 
tistisch inferierter Muster aus den Trainingsdaten gezogen und basieren nicht auf 
einem kognitiven Prozess des Abwägens oder Verstehens. Das Modell ist bislang 
genuin nicht in der Lage, logische Zusammenhänge herzustellen, Ableitungen zu 
treffen oder auch nur zu rechnen. Etwaige Verfahren des logischen Schließens und 


darauffolgenden Text integriert wird, so dass für die gleiche Aufgabe immer wieder andere Ant- 
worten erscheinen. 

63 Open Al, in [https://platform.openai.com/playground/p/1FVUOBZNJM]J2 {D54QF 2ylqfc?model=gpt- 
3.5-turbo-instruct] (Zugriff: 22.10.2023). 
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das Verständnis von Kausalitäten, das für das hermeneutische Verfahren von be- 
sonderer Bedeutung ist, sind zwar in Teilen der Ausgaben erkennbar, speisen sich 
aber sehr wahrscheinlich nur aus der Imitation der aus den Daten gelernten Muster. 

Dabei werden Informationen, die haufiger in den Trainingsdaten des Sprach- 
modells enthalten sind, in den Textausgaben verlässlicher abgebildet als solche, die 
nur selten erwähnt werden. Gleiches sollte auch für die Formulierung von Ant- 
worten auf spezifische Aufgaben wie Einordnungen, Kontextualisierungen oder 
Ableitungen gelten. 

Um es noch deutlicher zu sagen: LLM sind keine symbolischen Repräsenta- 
tionen der Welt, wie z.B. Knowledge Graphen, in denen Wissen über die Welt nach 
klaren Regeln formalisiert abgelegt wird, sondern statistische Repräsentationen der 
Sprache, mit der über die Welt gesprochen wird. In diesem Sinne gibt esin den LLM 
auch keine Wahrheit, das Modell kann nicht zwischen Wahr und Falsch unter- 
scheiden. Es gibt nur Wahrscheinlichkeiten. Von daher können LLM auch keine 
verlässlichen Aussagen über die Welt treffen, sondern nur Texte produzieren, 
welche die in den Trainingsdaten enthaltene Sprache und die darin abgebildeten 
Informationen in Bezug auf eine Aussage oder einen beigegebenen Text in einer 
plausiblen Art und Weise neu arrangieren. 

Dass es statt einer Wahrheit nur (scheinbare) Plausibilität gibt, mag auf den 
ersten Blick der Idee der Hermeneutik sogar entgegenkommen. Letztlich erstellt 
GPT vor dem Hintergrund seines Sprachmodells nur eine weitere mögliche Lesart 
eines Textes oder einer Aussage. Doch muss uns klar sein, dass dies nicht auf 
Grundlage eines eigentlichen Verstehensprozesses geschieht, sondern das Ergebnis 
eines rein „mechanischen“ Prozesses ist, der nicht durch eigene spezifische Inter- 
essen oder Intentionen gesteuert ist, und auch nicht durch Intuition, sondern 
durch Algorithmen und Gewichte. 


11.2 LLM als hermeneutische Instrumente 


Doch lässt sich diese „Mechanik“ im Sinne eines hermeneutischen Instruments 
unter bestimmten Voraussetzungen sehr wohl sinnvoll nutzbar machen. Durch in- 
context learning und geschicktes Prompting ist dieses grundlegend statistische 
Verfahren durch Nutzer:innen zumindest bedingt steuerbar, beispielsweise indem 
man verschiedene Kontexte im Dialog der Textgenerierung miteinander verbindet 


64 Durch die Einführung der „Temperature“ (s.o.) lässt sich aber zumindest ein damit definiertes 
Maß an Zufall einfügen, was zu potentiell „kreativ“ wirkenden, da weniger vorhersehbaren Ant- 
worten führt. 
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oder das gewünschte Verfahren in noch spezifischere Teilschritte unterteilt. Auf 
diese Weise lassen sich Angebote für mögliche Einordnungen, Kontextualisierungen 
und Bewertungen von Texten, Bildern oder einzelner Aussagen vor einem so ver- 
standenen potentiellen Informationshintergrund (oder auch „Verstehenshorizont“) 
generieren, der durch einen Menschen in ähnlicher Weise in dieser Breite nie 
abgedeckt werden könnte. Zumal wenn man bedenkt, dass GPT-4 multilingual 
trainiert wurde und damit generell auf sprachliche Aussagen in einer Vielzahl von 
Sprachen zurückgreift, was den potentiellen Referenzraum für etwaige Fragen 
noch einmal erheblich erweitert. Doch muss klar sein, dass die Ergebnisse in ge- 
wisser Weise nur Denkangebote sein können, die dann im weiteren Verlauf sehr 
kritisch zu prüfen sind. 

Fürs Erste scheint dies vor allem bei der Kontextualisierung von Texten und 
Aussagen funktional zu sein, wo es darum geht, konkrete Aussagen in einen brei- 
teren Kontext zu setzen oder durch Begriffsklärungen zu erhellen. Das Beantworten 
von Detailfragen auf der Ebene seltener und eher granularer Informationen, ins- 
besondere wenn hier auch spezifische Konzepte oder Modelle der Welt (wie z.B. 
Verwandtschaftsbeziehungen) sowie logische Operationen zur Anwendung kom- 
men müssten, ist derzeit wohl noch nicht adäquat möglich. Die Wahrscheinlichkeit, 
weitgehend korrekte Ergebnisse zu erlangen, ist hier erheblich geringer. Wobei man 
bei der Bewertung zukünftiger Einsatzmöglichkeiten dieser Modelle nicht aus- 
schließlich vom aktuellen Zustand ausgehen sollte, sondern auch mögliche und 
denkbare Weiterentwicklungen mit einbeziehen sollte. Schließlich sollte es heute 
kein Problem mehr sein, die gemäß Eingangszitat von Knut Eming in den 1980er 
Jahren übernommene Aufgabe, aus den ersten beiden Bänden der Gesammelten 
Werke Gadamers für häufig verwendete Begriffe die Hauptstellen zusammenzu- 
tragen und die beiden Bände damit zu verbinden, maschinell zulösen. Man braucht 
nur die obigen Prompts in ChatGPT der Version 3.5 einzugeben, um einen Eindruck 
davon zu erhalten, wie schnell sich die Technologie entwickelt. 

Eine weitere, und möglicherweise noch gravierendere, weil schnell übersehbare 
Einschränkung der Anwendbarkeit der aktuellen Sprachmodelle ist deren fehlende 
historische Tiefe. Es ist zwar möglich, dass das Modell Trainingsdaten zumindest ba- 
sierend auf unterschiedlichen Sprachstufen differenziert, doch grundsätzlich werden 
alle Daten, unabhängig von ihrem Entstehungszeitpunkt, gleichbehandelt. Das führt 
dazu, dass die am häufigsten vorkommenden Aussagen im Modell prominenter sind, 
während die neuesten Informationen möglicherweise unterrepräsentiert sind.® Diese 
Vermengung von historischen und aktuellen Daten kann zu Verfälschungen und 
Fehlinterpretationen führen, was die Zuverlässigkeit der generierten Sprache beein- 


65 Siehe Carlini et al. 2023. 


Hermeneutik in Zeiten der KI —— 231 


trächtigt. Darüber hinaus wird die Möglichkeit eines Nachvollzugs von Entwicklungen 
im Sinne von Gadamers Traditionen erschwert, es sei denn, solche Entwicklungen sind 
explizit in den Texten der Trainingsdaten selbst verankert. 

Entsprechend hängt sehr viel von den Daten ab, auf denen letztlich trainiert 
wurde, und ob diese in irgendeiner Art und Weise beim Training noch einmal ge- 
wichtet wurden. Genau hier nachzufassen und zu prüfen, wie unterschiedliche 
Quellen vielleicht auch unterschiedlich bewertet wurden oder bewertet werden 
können, und Ansätze zu entwickeln, wie die historische Tiefe der zugrundeliegenden 
Textkorpora abgebildet und nutzbar gemacht werden kann, wäre aus der Perspektive 
der digitalen Geschichtswissenschaften eine der drängendsten Aufgaben. Aus akade- 
mischer Nutzungsperspektive, die nicht auf schwer einzuschätzende Wahrschein- 
lichkeiten aufbauen, sondern Informationen und Wissen transparent bis zu deren 
Quelle zurückverfolgen und damit reproduzierbar und reliabel machen möchte, wäre 
es dabei sicher wünschenswert, Sprachmodell und die Repräsentation von Wissen zu 
trennen. Doch selbst hier bleibt die Herausforderung, dass auch das Sprachmodell 
selbst immer zeitgebunden sein wird. Oder könnte man sich z.B. ein Sprachmodell 
vorstellen, das allein auf Texten des 15. Jahrhunderts aufbaut und in diesem Sinne auch 
nur in der Sprache und mit den Konzepten des 15. Jahrhunderts nutzbar ist? 


11.3 LLM als Teil unseres hermeneutischen Prozesses 


Was uns zum letzten und vielleicht wichtigsten Punkt überhaupt bringt: Wie sich 
LLM als Instrumente eigentlich in unseren hermeneutischen Prozess einordnen 
lassen und wie dies unsere historische Wissensproduktion beeinflusst. Oder anders 
gefragt: Wie verstehen wir als menschliche Nutzer:innen eigentlich die Textausgabe 
der Maschine und wie können wir sie verarbeiten? Denn die Frage ist nicht nur, ob 
die Maschine hermeneutische Fähigkeiten hat, sondern auch, wie wir deren Aus- 
gabe eigentlich konkret in unseren Erkenntnisprozess integrieren können. 

Wie anfangs dargestellt, sieht Gadamer das Vor-Urteil gegenüber einem Ver- 
stehensobjekt, also eine irgendwie geartete individuelle Voreinstellung oder Mei- 
nung, als notwendige Voraussetzung zu dessen Verständnis an. Der Verstehens- 
prozess ist für ihn ein Hinterfragen, Revidieren und Erweitern dieses Vor- 
Verständnisses. Eine entsprechend große Rolle kommt diesem Vorverständnis da- 
her als Ausgangspunkt unseres Verstehens zu, und folglich müssen wir aus dieser 
Perspektive besonders kritisch mit den Ergebnissen der maschinell generierten 
Interpretationsangebote umgehen. Denn das hohe Maß an sprachlicher Plausibili- 
tät, welches die von Modellen wie GPT erstellten Texte vermitteln und worauf sie ja 
auch genau trainiert sind, mag rasch dazu verleiten, auch die Inhalte der so gene- 
rierten Aussagen als gültige Aussagen zu akzeptieren und diese zum Ausgangspunkt 
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des weiteren Verstehens zu machen und damit alles weitere Verstehen vorprägen 
zu lassen. Wollen wir diese Technologie in unseren hermeneutischen Prozess in- 
tegrieren, müssen wir uns dieses Effekts bewusst sein, nämlich wie stark - gerade 
auch in der Möglichkeit der dialogischen Annäherung an Begriffe, Aussagen, Texte 
oder historische Zusammenhänge - die in dieser Form vorgetragenen Antworten 
unsere Auseinandersetzung mit dem Gegenstand und unser Verständnis davon 
prägen können. Dies gilt übrigens auch für die Sprache selbst, mit der das Modell 
seine Antworten produziert, wenn wir davon ausgehen, dass die Welt durch Spra- 
che erfahren und begriffen wird und diese unseren Verstehensraum definiert. Die 
von LLM generierte Sprache stellt sicherlich ein statistisches Mittel über die trai- 
nierten Textkorpora dar, ist aber gerade dadurch sicher auch durch spezifische, 
zeitgebundene Vorannahmen und Vorverständnisse geprägt. 

Gerade der Umstand, dass geisteswissenschaftliche Wahrheit sich vor allem in 
Plausibilität ausdrückt, macht es notwendig, dass wir LLM als durch Theorien, Tech- 
nologien und Daten vorgeformte Instrumente verstehen und nur unter entsprechen- 
dem kritischem Vorbehalt einsetzen. Denn, und das ist vielleicht die wichtigste Fest- 
stellung in diesem Kontext, sie bleiben am Ende nur Instrumente, die uns im 
Verständnis bestimmter Dinge unterstützen können. Der eigentliche Verstehenspro- 
zess jedoch passiert nicht in der Maschine, sondern bei uns, wenn wir die Ausgaben 
der Maschine lesen und interpretieren. Was die Maschine letztlich ausgibt, sind zu- 
nächst einmal nur die von ihr berechneten bzw. inferierten Sequenzen von Token und 
damit von Wörtern und Wortschnippseln. Erst wir als Nutzende interpretieren diese 
Texte, versuchen diese zu verstehen und ordnen ihnen Bedeutung zu. Dazu brauchen 
wir als Nutzende den entsprechenden Verständnishorizont und damit die Bildung und 
die Erfahrung in der Auseinandersetzung mit dem jeweiligen Thema, um die Ausgabe 
der Maschine auch adäquat einordnen und weiterverarbeiten zu können; denn am 
Ende sind wir es, die diese Ausgabe verstehen müssen und die mit deren Hilfe das 
eigentliche Ergebnis produzieren. 

Wie Rubrizierungen, Register oder die Volltextsuche zuvor, sind auch Large 
Language Models damit zunächst einmal nur Instrumente, die man kritisch re- 
flektiert zu bedienen wissen muss, die uns dann jedoch auf eine jeweils spezifische 
Art und Weise helfen können, Texte, Bilder und andere Artefakte und die darin 
vermittelte Perspektive auf die Welt schneller, besser und umfänglicher zu verste- 
hen. Verstehen jedoch können nur wir selbst. 


Lukas Ohly 
Als was Texte erscheinen 


Phänomenologische Anmerkungen zu KI-Textgeneratoren 


Abstract: Texts do not always appear textual to us, but then they are not adequately 
understood as texts. If even their authors do not understand them as texts, they lack 
an intended object. It is only through the recipients that something intended comes 
into being. In this way, the responsibility is also transferred to the recipients to grasp 
something adequate with what is meant. Due to the scientific and disciplinary di- 
vision of labor, there is a danger of creating so-called „empty intentions“ — state- 
ments that have no meaning. In this respect, LLM merely carries a typical risk of the 
sciences to its extreme. From a metatheoretical point of view, it is all the more 
important to attribute the texts to authors who make a claim to validity with their 
text. 


1 Einleitung 


Alles, was erscheint, erscheint als etwas. Wenn ich von weitem einen Gegenstand 
sehe, den ich noch nie gesehen habe, sehe ich ihn dennoch als etwas, als ob ich 
etwas wie ihn schon gesehen hatte. Der dunkle Gegenstand ist dann ein Fleck oder 
ein Gebüsch. 

Und wenn ich weiß, wie ein Text aussieht, kann ich etwas als einen Text sehen. 
Ich kann weder arabisch lesen noch gesprochene arabische Texte verstehen. Aber 
wenn ich vor einem Zeitungsstand stehe, erkenne ich einen arabischen Text ebenso, 
wie wenn ich zwei Menschen sich auf Arabisch unterhalten höre. Ein Text ist also 
nicht nur ein Text, wenn ich ihn selbst als Sprachmedium benutze oder ihn ver- 
stehe. Etwas Unbekanntes kann uns auch als Text begegnen, ohne dass uns dadurch 
der Textsinn in seiner Syntax, Semantik und nicht einmal in seiner Pragmatik schon 
bekannt wird. Texte werden als Texte gesehen oder gehört, noch bevor sie als Texte 
gelesen oder verstanden werden. 

Damit behaupte ich noch nicht, was jetzt naheliegen könnte, dass KI lediglich 
auf dieser phänomenologisch basalen Ebene der Intentionalität operiert. Es ist für 
mich nicht klar, dass KI überhaupt etwas als etwas auffassen kann. Zunächst er- 
scheint es nur uns so, dass KI-Operatoren Muster erstellen, weil sie Muster sind. 
Damit eine KI selbst ein Muster als solches erkennt, muss dieses Muster auch für sie 
als Muster erkennbar sein. Man kann natürlich ein Programm so trainieren, dass es 
Muster als Muster erkennt. Aber daraus folgt nicht, dass das Training selbst nur 


8 Open Access. © 2024 bei den Autorinnen und Autoren, publiziert von De Gruyter. Dieses Werk ist 
lizenziert unter einer Creative Commons Namensnennung - Nicht kommerziell - Keine Bearbeitung 4.0 International 
Lizenz. https:/doi.org/10.1515/9783111351490-015 
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deshalb funktioniert, weil das Programm das Training als ein Muster auffasst. Es 
kann auch sein, dass das Programm „einfach so“ Muster auffasst, aber nicht, weil 
sie Muster sind, sondern weil die Programmierer es dazu aufgefordert haben, eine 
blind und automatisch durchgeführte Rechenoperation an bestimmten Momenten 
zu unterbrechen und die Zwischenberechnung bekannt zu geben - die uns dann als 
ein Muster erscheint. 

Ich behaupte auch nicht, dass mit dem Gesetz der Intentionalität erwiesen 
wäre, dass Texte einen transzendentalen Status haben oder gar einen ontologi- 
schen. Zum Vergleich: Einen Körper kann ich nur betrachten, weil ich seine 
Räumlichkeit mitunterstelle. Seine Räumlichkeit ist transzendental gegeben, nicht 
empirisch. Und nur aufgrund dieser transzendentalen Voraussetzung kann mir 
überhaupt empirisch ein Körper gegeben sein. Die Räumlichkeit ist für die Kör- 
perwahrnehmung unhintergehbar. 

Entsprechendes trifft jedoch auf einen Text nicht zu, dass ich ihn nur erfasse, 
weil Text dabei bereits den transzendentalen Hintergrund bildet. Ebenso wenig 
muss die Idee von Texten in einem platonischen Himmel existieren, bevor Men- 
schen Texte lesen, sprechen und verstehen können. Das Gesetz der Intentionalität 
ist vielmehr eine transzendentale Bedingung, überhaupt etwas wahrzunehmen. Ich 
kann etwas als Text wahrnehmen, auch wenn ich nicht weiß, was ein Text ist, und 
mich in allen Gehalten täusche, die man einem Text zuschreibt. Seine einheitliche 
Gegenständlichkeit ist mir vortextlich gegeben. Ein Kleinkind, das Buchseiten her- 
ausreißt, unterscheidet bereits zwischen den Seiten und dem Buchdeckel, ohne 
notwendigerweise zu verstehen, was einen Text ausmacht. 

Aus phänomenologischer Sicht erscheint ein Text primär als Gegenstand. Zu- 
gleich aber sind uns viele Gegenstände über Texte gegeben, zum Beispiel die ab- 
wesenden Gegenstände unserer Mitmenschen. Ich muss die Schwiegermutter 
meines besten Freundes noch nie gesehen haben. Dennoch ist sie mir gegeben, da er 
mir von ihr einmal erzählt hat. Ebenso können mir Texte über Texte gegeben sein, 
zum Beispiel ein Buch, das ich nie gelesen habe, aber eine Rezension davon lese. 
Überhaupt zeichnet Texte aus, dass sie als Texte nur dann adäquat gegeben sind, 
wenn sie textlich gegeben sind,’ sozusagen in ihrer „Textheit“: Damit meine ich, dass 
meine Wahrnehmung auf derselben Ebene steht wie das Wahrgenommene, näm- 
lich sprachlich verfasst. Das trifft auf andere Gegenstände nicht zu: Eine Amsel 
kann ich nicht nur beim Anblick in ihrer „Amselheit“ adäquat erfassen, sondern 
auch textlich. Eine adäquat nur beschriebene Amsel kann denselben intentionalen 
Gehalt haben wie eine Amsel, deren Gesang ich höre. Aber ein Text, der beschrieben 


1 Wie ich am Beispiel des Kindes, das Buchseiten zerreißt, veranschaulicht habe, können Texte 
bereits inadäquat gegeben sein. 
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wird, wird mit derselben Erscheinung erfasst, wie ihr intentionaler Gehalt als Text 
ist. Texterscheinung (der augenblickliche Eindruck), Texterscheinen (die Einheit des 
Erscheinens durch alle augenblicklichen Intensitäten hindurch) und intentionaler 
Gehalt (Gegenstand)? sind bei Texten von derselben Art. Es zeichnet also einen Text 
aus, nur in einer reduzierten Zugangsweise adäquat gegeben zu sein, nämlich über 
seine Art. Er erscheint als etwas über dieselbe Art dieses Etwas. Dass Sprache 
Medium ist, verdankt sich dieser reduzierten Gegebenheitsweise.” Zwar kann 
prinzipiell alles zum Medium werden, aber was ein Medium ist, wird genau in 
demjenigen Etwas aufgefasst, das sich auf seine Medialität reduziert. 


2 Wissenschaftliche Texte und das „Geplapper 
eines Papageis“ 


Wissenschaft arbeitet vor allem mit dieser reduzierten Zugangsweise der Erschei- 
nungen. Mit Friederike Kuster kann man etwas überspitzt davon sprechen, dass 
sich Wissenschaft von Erscheinungen entfernt, indem sie sich stark darauf fokus- 
siert, wie Erscheinungen textlich reduziert werden: 


Wenn aber, wie wir zu zeigen versuchen, meine Erfahrung und vor allem die Aussprache 
meiner Erfahrung im Medium des anonymen ‚Systems von Zeichen‘ in seinem assoziativen 
und diskursiven Charakter eine mir auch immer schon entfremdete ist, in dem Sinne, daß sie 
mir nie völlig einholbar und verfügbar ist, so bedeutet das, da mein Sprechen immer schon ein 
Nachsprechen ist, und daß also nur ausgehend vom Bewußtsein dieses Nachsprechens wirk- 
lich verantwortliches Sprechen stattfinden kann.* 


2 Zur Unterscheidung von Erscheinung, Erscheinen und Gegenstand s. Edmund Husserl, Vorle- 
sungen über Ethik und Wertlehre (1908-1914), Dordrecht 1988, 307, 312: „Die Erscheinung ist bewußt 
im Erscheinen, aber sie ist kein Teil, keine Seite, kein Stück des Erscheinens; ebenso im weiteren 
Sinn nicht die Meinung im Meinen. Die Phantasieerscheinung ist nicht das Phantasieerscheinen, sie 
ist aber auch nicht der phantasierte Gegenstand.“ 

3 Damit sind Folgephänomene verbunden, zum Beispiel der hermeneutische Zirkel: Da Texte als 
Texte adäquat nur textlich gegeben sind, wird auch Medialität nur textlich verstanden. Ich kann also 
nur dann etwas als etwas verstehen, wenn ich bereits etwas als Medium verstehe. Dazu muss ich 
also bereits ein Medienverständnis haben, um etwas als Medium zu verstehen. Und ich kann nur ein 
Medienverständnis haben, wenn mir etwas als Medium gegeben ist. In dieser Zirkularität bewegt 
sich das Sprachverstehen. 

4 Friederike Kuster, Wege der Verantwortung. Husserls Phänomenologie als Gang durch die Fakti- 
zität, Dordrecht et al. 1996, 78. 
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Dazu gehören logische Schlussfolgerungen, die das, was sie zur Erscheinung brin- 
gen, mit ihrer eigenen Erscheinungsart identifizieren. Dass Sokrates sterblich ist, 
sieht man ihm dann nicht unbedingt an, sondern ergibt sich über die Erschei- 
nungsweise von Texten durch Texte, eben so, dass sich Texte durch Texte zur Er- 
scheinung bringen lassen, ohne dass andere Erscheinungsweisen nötig sind. 

Diese Reduktion ist unausweichlich. Man müsste schon diese Reduktion redu- 
zieren, um sie loszuwerden. Dann aber fehlen uns die Worte für die Phänomene, die 
die Wissenschaft untersucht. Wir können also nur Wissenschaft betreiben, indem 
wir uns durch die Sprache zugleich von den Erscheinungen distanzieren, die wir 
wissenschaftlich untersuchen. 

Die Gefahr allerdings besteht nun, dass die wissenschaftstypische Reduktion 
über Texte eine Eigendynamik gewinnt, die gar keine „Bedeutungsintention“° mehr 
hat, sich also auf keinen erscheinenden Gegenstand bezieht außer auf ihre eigene 
Erscheinungsweise. Weil Gegenstände mit Hilfe von Texten erschlossen werden 
können, kann die Illusion entstehen, dass die Erscheinungsweise von Texten die 
jeweiligen Gegenstände ersetzen könnte: Texte bringen Texte zur Erscheinung, als 
ob damit alles über den intentionalen Gehalt der in ihnen behandelten Gegenstände 
ausgesagt wäre. 

Eben das könnte als das „Geplapper eines Papageis“ aufgefasst werden, das 
einen Text zur Erscheinung bringt, ohne dass mit ihm etwas gemeint wird. Es fehlt 
dann die „aktive Bedeutungsintention“’. Dieses Risiko ist wissenschaftstypisch. 
Denn Wissenschaft braucht bis zu einem gewissen Grad die Konzentration auf 
textinterne Referenzen, um textlich etwas auszudrücken. Aber gerade dadurch 
entfernt sie sich von den untersuchten Gegenständen. Dadurch werden Texte selbst 
zum Explanandum. Es wird dadurch zu einer graduellen Frage, wie weit sich 
Wissenschaft von ihrem Gegenstand entfernen kann, um noch als Wissenschaft 
dieses Gegenstandes gelten zu können. 


«6 


3 KI-Textgeneratoren als Werkzeug 


Künstlich intelligente Textgeneratoren stehen daher einerseits in einer Reihe mit 
wissenschaftstypischen Instrumenten, sind aber andererseits mit dem besonderen 
Risiko ausgestattet, den behandelten Gegenstand zu verfehlen. Man kann nun fra- 
gen, ob KI-generierte Texte grundsätzlich dem „Geplapper eines Papageis“ ähneln 


5 Ebd. 
6 Ebd. 
7 Ebd., 79. 
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oder ob sie nur graduell mehr oder weniger in denselben dialektischen Prozess des 
Gegenstandsbezugs durch Gegenstandsentfernung gehören, wie es bei anderen 
wissenschaftlichen Verfahren der Fall ist. 

Zu unterscheiden ist dabei, ob der KI-Textgenerator ein Werkzeug für eine 
Wissenschaftlerin aus Fleisch und Blut ist oder ob er selbst als Autor fungiert. Als 
Werkzeug ist zu beachten, dass für die Wissenschaftlerin der Textgenerator mit 
Texten operiert, dass also aus ihrem Blick der intentionale Gegenstand des Text- 
generators selbst Texte sind. Wenn man den Textgenerator beispielsweise mit der 
Aufgabe betraut: „Schreibe mir einen Aufsatz über die Effektivität von Steuerer- 
höhungen für ein klimafreundliches Verhalten“, fokussiert er sich nicht tatsächlich 
auf das Klima oder die Steuerpolitik, sondern entwickelt mit seiner programmty- 
pischen Logik einen Text über Texte zu Steuerpolitik und Klimaschutz. 

Die Wissenschaftlerin erfährt vom künstlich generierten Text nicht, welche 
Steuerpolitik für den Klimaschutz effektiv ist. Sie erfährt nicht einmal, wie in der 
Literatur darüber nachgedacht wird. Sondern sie erfährt, wie der Textgenerator 
verfügbare Literatur als Bausteine verwendet und in einem Artikel zusammenstellt. 
Der künstlich erstellte Text gibt also zu erkennen, welche inhaltlichen Schwer- 
punkte sich aus seinem Programm ergeben können. Nur können! Denn stellt man 
dem Textgenerator dieselbe Aufgabe noch einmal, dann wird ein anderer Text 
entstehen. Dennoch kann dieses Verfahren als Werkzeug hilfreich sein. Das ist vor 
allem dann der Fall, wenn das Programm transparent ist. Wenn das Programm 
etwa so vorgeht, die wahrscheinlichste Folge der Tokens? zum Thema zu erzielen, 
dann erfährt die Wissenschaftlerin mit dem Textergebnis, wie sich diese Wahr- 
scheinlichkeit für den Textgenerator darbietet. Daraus können immerhin mittelbare 
Schlüsse zur aktuellen Diskurslage gezogen werden. Daraus folgt natürlich nicht, 
dass die Argumentation des künstlich generierten Textes wahr ist. Das müsste 
vielmehr die Wissenschaftlerin in einem zweiten Schritt an den behandelten Ge- 
genständen prüfen (Klimaschutz, Steuerpolitik). Das trifft aber auf alle Texte zu, 
auch auf menschlich verfasste Texte: Ihre Wahrheit kann nicht am Text selbst 
überprüft werden. 

Textgeneratoren verfassen also Beiträge, die für ein bestimmtes Thema als 
repräsentativ erscheinen mögen. Sie erscheinen aber nur uns Menschen als re- 
präsentativ, weil nur wir intentional etwas als Text erfassen. Und diese künstlich 
generierten Beiträge erscheinen uns auch nur dann als repräsentativ, wenn uns die 
Methode einleuchtet, mit der diese Texte generiert worden sind. Dazu muss die 
Methode uns aber bekannt sein. 


8 Zum Begriff „Token“ siehe den Beitrag von """Ulrike Aumüller/Maximilian Behrens/Colin Kava- 
nagh/Dennis Przytarski/Doris Wefels=== in diesem Band. 
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Natürlich könnte ein Text uns auch als nicht-repräsentativ erscheinen. Das ist 
dann der Fall, wenn wir die Diskurslage einigermaßen selbst überblicken können 
und Abweichungen zwischen unserer Expertise und dem Textinhalt feststellen. Ob 
der Text wahre Aussagen trifft, hängt aber nicht daran, ob er ein repräsentativer 
Beitrag ist, sondern ob er den Gegenstand trifft, ob also der intentionale Gehalt 
adäquat dargestellt ist. Das aber kann nicht am Text allein entschieden werden. 
Darin erschöpft sich dann der Textgenerator als wissenschaftliches Werkzeug: Er 
stellt die Diskurslage für uns als repräsentativ dar. Dies dient als Ausgangspunkt, 
von dem aus wir weitere Untersuchungen anstellen und Schlüsse ziehen können. 
Prägnant ausgedrückt: Textgeneratoren können Wikipedia-Artikel schreiben, sie 
können aber keine Wikipedia-Administratoren sein, die die Artikel auf Wahrheit 
überprüfen. Um das zu können, müssten KI-Textgeneratoren mit anderen wissen- 
schaftlichen Werkzeugen gekoppelt werden. Und ob diese anderen Werkzeuge 
wieder künstliche Intelligenzen sein können, hängt von den jeweiligen Wissen- 
schaften ab. 


4 KI-Textgeneratoren als Autoren 


Doch was passiert, wenn das Werkzeug selbst zum Autor wird? Dann wird dadurch 
verschleiert, dass hinter dem Text kein Geltungsanspruch liegt, weil der Autor Texte 
ohne intentionale Gehalte verfasst. Künstliche Intelligenz kann eben nicht Muster 
als Muster entwerfen und damit auch nicht etwas als etwas wahrnehmen. Das 
müsste sie aber können, wenn sie einen Geltungsanspruch vertritt. Sie müsste nicht 
nur in der Lage sein, auf die Frage zu antworten, wie sie auf ihre Ergebnisse ge- 
kommen ist. Sie müsste vielmehr außerdem ihre Begründung als Begründung auf 
die Rückfrage auffassen. Ohne intentionales Wahrnehmen ist sie allerdings dazu 
nicht fähig. Ihre Begründungen können daher nur uns als Begründungen erschei- 
nen, wenn dadurch unsere Intentionen des jeweiligen Forschungsgegenstands er- 
füllt werden.” Das heißt aber, dass KI-Textgeneratoren niemals in die Rolle von 
echten Autoren springen können. Selbst wenn KI-Textgeneratoren Autorenschaft 
vorgaukeln, indem sie mit Zufallsgeneratoren kreative Thesen entwickeln und 
heuristisch (abduktiv'®) erschließen, bleibt dieser Vorgang ja nicht-intentional: Ihre 
Texte bleiben darauf angewiesen, dass sie von uns zur Anschauung gebracht wer- 
den. 


9 Edmund Husserl, Ding und Raum. Vorlesungen 1907, Den Haag 1973, 105. 
10 Charles S. Peirce, Vorlesungen über Pragmatismus, Hamburg 1991, 96. 
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Das Problem besteht nun darin, dass nur Expertinnen erkennen können, ob das 
der Fall ist. Für alle anderen Wissenschaftlerinnen gilt, dass sie Forschungsergeb- 
nissen vertrauen müssen, weil sie deren Zustandekommen nicht selbst überprüft 
haben oder nicht überprüfen können. Nehmen wir folgendes Szenario an: 

Eine Wirtschaftsethikerin, die aber keine Ökonomin ist, will untersuchen, ob es 
legitim ist, mit der Steuerpolitik ein klimafreundliches Verhalten der Staatsbürger 
zu erzielen. Dabei vertraut sie einem ökonomischen, aber nicht wirtschaftsethi- 
schen Text, der von einem KI-Textgenerator erstellt worden ist. Dieser Text be- 
hauptet, dass Steuererhöhungen nur für das reichste Zehntel der Bevölkerung eine 
positive Klimabilanz erzielen, und zwar erst bei einer Steuerquote ab 80 Prozent des 
Einkommens. Natürlich könnte die Ethikerin nun auch andere Literatur zur 
Kenntnis nehmen, aber diese alternativen Studien sind im KI-Text mitverarbeitet 
und Gegenpositionen für die Ethikerin glaubhaft entkräftet worden. Ob das Sze- 
nario aus dem KI-Text wahr ist, wird sie nur entscheiden können, wenn sie einen 
Wirtschaftsexperten kennt, der ihr die Wahrheit des Artikels bescheinigt. Das re- 
lativiert die Glaubwürdigkeit von Texten aus benachbarten Disziplinen. 

Nehmen wir noch zusätzlich an, dass der freundliche Kollege aus der Nach- 
barfakultät nicht persönlich antwortet, sondern selbst einen Textgenerator ver- 
wendet, um die Zeit für lästige E-Mail-Korrespondenz einzusparen oder mit seiner 
geklonten Stimme Telefongespräche zu ersetzen. Dann wird die Verschleierung 
eines angeblichen Geltungsanspruchs für die Ethikerin noch verstärkt. 

Nehmen wir noch zusätzlich an, dass die Ethikerin selbst KI-Textgeneratoren 
verwendet, nun zwar nicht als Autoren, aber als Werkzeuge. Diese Werkzeuge 
stellen ihr zur Verfügung, welche Argumente im ethischen Diskurs um eine wirk- 
same Klimapolitik repräsentativ zu sein scheinen. Die Ethikerin überprüft diese 
Argumente und entwickelt eine eigene Position mit einem Geltungsanspruch. Dann 
kann es sein, dass sich ihr Beitrag auf ein Steuerszenario bezieht, das völlig an den 
Haaren herbeigezogen ist. Der ethische Diskurs um Steuererhöhungen verliert dann 
andere ökonomisch effektive Instrumente aus dem Blick, weil die Ethikerin mög- 
licherweise fälschlich darauf vertraut, dass ein Steuersatz ab 80 Prozent für die 
Reichen eine repräsentative und valide Strategie für die Klimapolitik ist. 

Was ist dann passiert? Die Künstliche Intelligenz filtert oder reduziert die 
Diskurslage. Es reden zwar immer noch Menschen mit und bringen die nötigen 
Geltungsansprüche ein, aber worüber geredet wird und worauf sich die Geltungs- 
ansprüche beziehen, wird maßgeblich von der KI vorgegeben, die sich als Autorin 
geriert. Denn wenn alle Wissenschaften ohnehin auf die Forschungsergebnisse 
anderer Disziplinen vertrauen müssen, dann ist es möglich und sogar zu erwarten, 
dass eine Forscherin den Unterschied nicht erkennt, ob sie einer Studie vertraut 
oder einem Text, der nur vorgibt, eine zu sein. Nicht am Text zumindest ist der 
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Unterschied erkennbar, solange die Wissenschaftlerin seinen Geltungsanspruch 
nicht selbst überprüfen kann. 

Umso wichtiger wird jetzt die Frage, wer den Text geschrieben hat. Und die 
epistemische Zugangsweise zur Beantwortung dieser Frage ist interpersonales 
Vertrauen. Auch dieses Vertrauen lässt sich nicht an den Texten der Person belegen, 
der vertraut wird, sondern zirkulär daran, dass es sich bislang bewährt hat - 
freilich nur, weil man darauf vertraut, dass es sich bislang bewährt hat. Je weniger 
man einem Text ansieht, ob mit ihm ein Geltungsanspruch verbunden wird, desto 
wichtiger wird das vor-wissenschaftliche Vertrauen in Personen. Das bedeutet zu- 
gleich, dass Texte textlich unter Wissenschaftlerinnen zunehmend Misstrauen 
provozieren, also auf derselben Ebene, auf der Texte adäquat als Texte erfasst 
werden. Das Misstrauen besteht nicht nur darin, ob eine Person als Autorin hinter 
dem jeweiligen Text steht, sondern auch, ob er ein Text mit Geltungsanspruch ist — 
weil das Verfahren, mit dem der Text zustande gekommen ist, ohne Intentionalität 
verbunden gewesen sein könnte. Der Text sieht zwar wie eine wissenschaftliche 
Abhandlung aus, ist aber nicht durch einen Gegenstandsbezug zustande gekommen, 
sondern durch verfahrensinterne Wahrscheinlichkeitsreferenzen. 


5 Künstlich generierte Texte als Spezialfall 
wissenschaftlicher Reduktion 


Mir scheint, dass künstlich generierte wissenschaftliche Texte nur einen Spezialfall 
dessen darstellen, was die wissenschaftliche Kooperation generell prägt. Durch die 
Arbeitsteilung in unterschiedlichen Disziplinen können Forscherinnen nicht alles 
selbst überprüfen, was sie für ihre Abhandlungen in Gebrauch nehmen. Sie werden 
weder in jedem Geltungsanspruch, der in einer Nachbardisziplin liegt, einen Kol- 
legen haben, dem sie persönlich genug vertrauen, um von ihm eine Bestätigung 
ungeprüfter These zu bekommen. Noch werden sie überhaupt alle ungeprüften 
Geltungsansprüche aus ihren eigenen Beiträgen kennen. Viele Voraussetzungen 
werden für sie lebensweltlich lokalisiert sein, das heißt, sie bilden selbstverständ- 
liche Hintergrundannahmen, die als solche nicht einmal auffallen.’ Man kann 
sagen, dass solche Hintergrundannahmen auch keine intentionale Struktur haben: 
Dass die Erde keine Scheibe ist, haben wir nicht als Hintergrundannahme abge- 
speichert, bildet aber eine unhinterfragte Voraussetzung des Klimaschutzes. Ori- 
ginäre Geltungsansprüche einer Autorin sind nur möglich in den Grenzen dieser 
Hintergrundannahmen - die zwar nicht fixiert sind, sondern sich ändern können, 


11 Jürgen Habermas, Theorie des kommunikativen Handelns, Bd. 1, Frankfurt a.M. 1988, 449. 
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genauso wie man misstrauisch werden kann, ob ein bestimmter Text wirklich von 
einem Menschen verfasst worden ist. Aber trotzdem bleiben immer Hintergrund- 
annahmen zurück, die nicht entdeckt werden. 

Meine These lautet nun, dass mit künstlich generierten Texten der Bereich 
nicht-intentionaler Implikationen wissenschaftlicher Forschung anwächst. Das, was 
bislang die Lebenswelt ausmachte, wird angereichert mit Texten, die nur durch 
Experten intentional werden, weil nur sie überprüfen können, ob hinter den Texten 
überhaupt ein Forschungsgegenstand steht und ob er angemessen beschrieben 
wird. Für alle anderen Wissenschaftlerinnen herrscht jetzt entweder generelles 
Misstrauen, ob Texte versprechen, was sie zu sein scheinen (nämlich einen Gel- 
tungsanspruch zu erheben), oder das Fehlen des Geltungsanspruchs bleibt uner- 
kannt, und man benutzt die Texte naiv. Dann werden die Textergebnisse in anderen 
Texten wiederholt, ohne dass ihnen ein intentionaler Gegenstand entspricht. Oder, 
falls ihnen doch ein intentionaler Gegenstand entspricht, dann wird er durch die 
menschliche Vorstellung erschaffen, die etwas meint, während im künstlich gene- 
rierten Text nichts gemeint sein kann. Eine Wissenschaftlerin stellt sich dann etwas 
vor, wovon sie nicht weiß, ob die Vorstellung adäquat ist, weil sie sich ja in der 
betreffenden Nachbardisziplin nicht auskennt und weil der Text, aus dem sie ihre 
Vorstellung entwickelt, nichts Vorstellbares gemeint hat. 

In beiden Fällen wird die wissenschaftliche Adäquanz derjenigen menschli- 
chen Beiträge geschwächt, die solche Texte rezipieren. Im ersten Fall wird der 
methodische Zweifel in ein existenzielles Misstrauen eingetauscht: Die Wissen- 
schaftlerin zweifelt nicht nur daran, ob eine Aussage wahr ist, und sucht nach 
geeigneten Überprüfungsmethoden. Vielmehr muss sie sogar den Texten miss- 
trauen, weil die in Texten angebotenen Überprüfungsmethoden selbst nicht-in- 
tentionale Silbenreihen sein könnten. Wenn erstens manche Texte nicht sind, was 
sie zu sein vorgeben, und wenn man zweitens nicht an den Texten erkennen kann, 
ob sie intentional sind, hilft das Vertrauen in die Expertise von Kollegen aus der 
Nachbarwissenschaft nicht mehr. Denn diese Kollegen haben ja dasselbe Problem 
und bringen Hintergrundannahmen ein, die durch das „Geplapper eines Papageis“ 
geprägt sind. Ein methodischer Zweifel muss sich immerhin noch auf Textbedeu- 
tungen verlassen können. Wenn aber die Textbedeutungen möglicherweise keine 
Intentionalität haben, muss die Wissenschaftlerin schon daran zweifeln, ob ihr 
Zweifel überhaupt auf etwas gerichtet ist. Sie zweifelt dann nicht erst daran, dass 
der intentionale Gegenstand adäquat beschrieben ist, sondern daran, dass Texte 
überhaupt einen intentionalen Gegenstand haben. 

Im zweiten Fall werden wissenschaftliche Texte von naiven Vorurteilen flan- 
kiert. Denn was die Wissenschaftlerin selbst schreibt, nimmt ungeprüfte Aussagen 
aus Nachbardisziplinen auf, die nicht nur sie nicht geprüft hat, sondern die gar 
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nicht geprüft worden sind, weil der KI-Textgenerator sich nicht am Gegenstand 

orientiert hat, sondern an Texten über einen Gegenstand. 

Ich erinnere daran, dass es sich hier um nichts grundsätzlich Neues handelt, 
insofern sich wissenschaftliche Texte immer schon von Erscheinungen entfernt 
haben. Die Sprache konnte schon immer „feiern“'?, weil man „leere Intentionen“? 
ungeprüft weitergetragen hat und aus ihnen Schlüsse gezogen hat, die dann auch 
leer waren. Es verändert sich aber nun doch grundsätzlich das Textverständnis, und 
zwar aus zwei Gründen: 

1. Mit KI-Textgeneratoren kann die Masse an vermeintlich wissenschaftlichen 
Publikationen ins Unermessliche gesteigert werden. Texte können nun auto- 
matisch verbreitert werden und der Bereich wissenschaftlicher Autorenschaft 
durch Schein-Autoren überschwemmt werden. Damit ist auch ein maßlos ge- 
steigertes Misstrauen in wissenschaftliche Texte angebracht. 

2. Auch wenn KI-Textgeneratoren nur ausnahmsweise und in engen Grenzen 
wissenschaftlich verwendet werden (z.B. als Werkzeug für die Wissenschaft- 
lerin, nicht als Autoren), provoziert allein die Möglichkeit, dass Nicht-Inten- 
tionalität in wissenschaftliche Diskurse eingeht, ein erhöhtes Misstrauen in sie. 


Was sich also verändert, ist das unermesslich gesteigerte Misstrauen an der In- 
tentionalität von Texten. Das ändert aber nichts daran, dass Texte Texte sind, die 
textlich als Texte gegeben sind. Auch das „Geplapper eines Papageis“ ist ein Text. 
Fraglich wird jetzt nur, ob sich Texte noch als Medien wissenschaftlicher Erkenntnis 
eignen, wenn ihnen aus Gründen der wissenschaftlichen Redlichkeit grundsätzlich 
misstraut werden muss. Könnte es also sein, dass der Medialität selbst zu miss- 
trauen ist? KI-Textgeneratoren verarbeiten Texte zwar, aber sie verarbeiten sie 
nicht als Texte, sondern zwischen Text und Text schiebt sich eine kalkulatorische 
Verarbeitungsmethode, die formal immer gleich, aber nicht textlich ist. Das Ver- 
arbeitungsprogramm beruht auf Wahrscheinlichkeitsverstärkungen: Das „neuro- 
nale“ Netzwerk einer künstlichen Intelligenz liefert einen Output von denjenigen 
Datenansammlungen, die sich irgendwie verstärken. 


12 Ludwig Wittgenstein, „Philosophische Untersuchungen“, in Werkausgabe, Bd. 1, Frankfurt a.M. 
61989, 225-580, § 38. Wittgenstein spottet dort über die Vorstellung, dass bei einer Benennung zwi- 
schen Wort und Gegenstand ein „seelischer Akt, quasi eine Taufe“ stattfindet. Dieser seelische Akt 
müsste dann ebenso ein nicht-intentionaler Zwischenschritt sein, da er ansonsten selbst von einem 
weiteren intentionalen Zwischenschritt abhängig wäre usw. ad infinitum. Bekanntlich will Witt- 
genstein das Benennungsproblem mit dem Sprachspiel des Benennens auf pragmatische Weise 
lösen. Dieses Sprachspiel setzt aber die Intentionalität voraus, dass immer schon etwas beim Be- 
nennen gemeint ist - noch bevor es gemeint ist. 

13 Husserl 1973, 57. 
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Nun könnte man einwenden, dass das ja auch vom menschlichen Gehirn gilt, 
dass es sich zwischen Text und Text schiebt — dass uns Texte also nicht nur textlich 
erscheinen, sondern vorher neuronal verarbeitet werden müssen, bevor sie wieder 
in Textmedien übergehen. Der entscheidende Unterschied aber liegt darin, dass die 
Zwischenverarbeitung in einem menschlichen Gehirn nicht verstanden werden 
muss, damit die Medialität von Texten erscheint. Texte werden als Texte nur ad- 
äquat verstanden, wenn sie textlich aufgefasst werden. Deshalb können Texte 
Medien sein. Ihre Medialität muss nicht den Umweg über neurologische Prozesse 
gehen, um als Medialität verstanden zu werden. Und sie kann auch diesen Umweg 
nicht gehen, weil sich Medialität nicht neuronal ergibt, sondern textlich. Die neu- 
ronale Verarbeitungsmethode erklärt die Medialität nicht. 

Ein KI-Textgenerator dagegen fasst Texte nicht als Texte auf. Wenn er Texte aus 
Texten generiert, sind die Texte, die den Input geben, kein intentionaler Gegenstand 
für den Output. Vielmehr besteht zwischen Verarbeitungsprozess und dem fertigen 
Text keine Lücke, die eine Vermittlung (Medialität) nötig machen würde.'* Der KI- 
Textgenerator hat daher keine Fähigkeit zum Verständnis: Weder kann er verste- 
hen, noch ist ihm etwas zu verstehen gegeben. Man könnte sagen: Obwohl uns auch 
künstlich generierte Texte als Texte erscheinen, gelangen diese generierten Texte 
nie „nach draußen“. Ihr Bezug zueinander liegt unvermittelt im Programm. Zwi- 
schen Input, Output und Verarbeitung gibt es keine Lücke, in der so etwas wie 
Medialität entstehen könnte. Im Unterschied zur menschlichen Textverarbeitung, 
bei der die Betrachtung des Verfahrens oft als überflüssig angesehen wird, ist sie 
hier unerlässlich. Der Output fungiert zugleich als Input und beeinflusst so die 
Wahrscheinlichkeiten zukünftiger Outputs.’® 

Man kann es aufregend finden, dass man einem Textgenerator dieselbe Auf- 
gabe mehrfach stellen kann und er sie dann verschieden löst. Aber das liegt gerade 
an der lückenlosen Verarbeitungsmethode: Gerade weil eine Unmittelbarkeit vor- 
liegt, heißt das nicht, dass die Künstliche Intelligenz trotz unterschiedlicher Re- 
sultate sich verändert hätte. Das Verfahren bleibt gleich, auch wenn die Texte im 
Output verschiedene sein können: Es besteht eben eine unmittelbare Indifferenz 
zwischen Verarbeitung und Resultat. Ein Mensch, der etwas zu sagen hat, wird zur 
selben Aufgabe immer Ähnliches sagen — weil er jeweils in etwa das Gleiche meint. 
Das trifft auf einen Textgenerator nicht zu, weil nicht etwa der intentionale Ge- 
genstand der gleiche wäre, über den der Text entsteht, sondern weil die Verar- 
beitungsmethode immer gleich ist: Wenn nur Wahrscheinlichkeiten entscheiden, 


14 Ich verdanke diese Beobachtung Kathrin Burghardt. 

15 Diese Funktionsweise zeigt sich an sogenannten autoregressiven KI-Sprachmodellen, bei denen 
die bereits entwickelten Textbausteine als Wahrscheinlichkeitsparameter für die weiteren Se- 
quenzen desselben Textes fungieren. 
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welche Silbe im Text als nächstes erscheint, ist von der Verarbeitungsmethode aus 

gesehen jede gleich wahrscheinliche anschließende Silbe gleich richtig (und jede 

ähnlich wahrscheinliche anschließende Silbe ähnlich richtig). 

Zugespitzt gesagt, heißt das: Künstlich generierte Texte können uns zwar als 
Medien erscheinen, aber wenn wir erfahren, wer sie verfasst hat, erscheinen sie 
uns nicht mehr als Medien, sondern unbestimmt weiter gefasst als Gegenstände. Sie 
können zwar als Texte erscheinen, aber da ihre „Autoren“ keine textliche Auffas- 
sung von ihnen haben, sind diese Texte keine Medien des intentionalen Gegen- 
standes, den sie zu beschreiben scheinen. Erst Menschen können sie zu Medien 
machen, weil Menschen textlich Texte verfassen und die künstlich generierten 
Texte textlich verstehen können. Dafür gibt es zwei Möglichkeiten: 

1. Entweder der Mensch durchschaut nicht, dass der Text künstlich generiert ist. 
Dann bildet er den intentionalen Gegenstand nach, der im Text nur scheinbar 
vorkommt. Die Gefahr ist das „Geplapper des Papageis“: Leere oder falsche 
Bedeutungsintentionen werden dann in weiteren Texten ungeprüft weiterge- 
tragen. 

2. Oder der Mensch durchschaut den Trick. Dann sind die künstlich generierten 
Texte keine Medien für den angeblichen intentionalen Gegenstand, sondern für 
die Abwesenheit des intentionalen Gegenstandes. Der Mensch interpretiert 
dann, wie KI-Textgeneratoren mit Texten umgehen. Der intentionale Gegen- 
stand ist nicht der angebliche aus den Texten, sondern das jeweilige KI- 
Sprachmodell, und seine Texte werden dann vom Menschen zu Medien der 
Textgeneratoren erhoben. 


6 Eine Phänomenologie der Phanomenologie des 
Texterscheinens 


Die bisherigen Überlegungen wollten keine Ratschläge geben, wie man dem uner- 
messlich gesteigerten „Geplapper des Papageis“ entkommen kann. Sie bewegten 
sich allein auf der Ebene der phänomenologischen Beschreibung. Aus dieser Sicht 
werden sich KI-Sprachmodelle mit einer klugen Anwendung als nützliche Werk- 
zeuge für die Wissenschaft herausstellen; aber sobald sie als Autoren fungieren, 
droht die Wissenschaft, den Boden unter den Füßen zu verlieren, also den Wirk- 
lichkeitsbezug — das, was man phänomenologisch die „Transzendenz in Immanenz“ 
nennt.'® Wie man sich Abhilfe verschaffen kann, liegt nicht im Horizont dieser 
phänomenologischen Überlegung. Vielmehr muss jeder Vorschlag einer Problem- 


16 Edmund Husserl, Cartesianische Meditationen und Pariser Vorträge, Den Haag 1950, 32. 
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lösung sich selbst wieder an einer phänomenologischen Betrachtung messen las- 
sen. 

Man kann aber die Frage, wie KI-Textgeneratoren wissenschaftliche Diskurse 
verändern, auch aus einer anderen Perspektive stellen. Bisher habe ich gefragt, wie 
sich Diskurse verändern, dadurch dass Textgeneratoren selbst in diese Diskurse mit 
eigenen Texten eingreifen. Man kann aber auch anders fragen, wie sich die Diskurse 
verändern, weil Menschen über Generative AI Diskurse führen. Wie anders werden 
Texte wahrgenommen und wie die Wissenschaft, weil Menschen damit rechnen, 
dass Textgeneratoren in die Diskurse eingreifen, unabhängig davon, ob sie es bisher 
überhaupt getan haben. 

Aus Sicht der Phänomenologie bietet sich jetzt eine Metatheorie an, eine Phä- 
nomenologie der Phänomenologie des Texterscheinens. Ich will also meine bishe- 
rigen Überlegungen selbst einer phänomenologischen Reduktion unterziehen. Statt 
zu fragen, wie künstlich generierte Texte erscheinen, frage ich jetzt, wie die phä- 
nomenologische Untersuchung über künstlich generierte Texte erscheint. 

Sie erscheint so, dass ihre intentionalen Gegenstände eine phänomenologische 
Reduktion durchlaufen haben. Die Texte eines LLM erscheinen dabei als Texte, und 
überraschenderweise haben sie in der Phänomenologie zweiter Ordnung einen 
intentionalen Gegenstand: nämlich die KI-Sprachmodelle selbst. Während die bis- 
herige phänomenologische Untersuchung unterstellt hat, dass künstlich generierte 
Texte keinen intentionalen Gegenstand haben, haben dieselben Texte auf der me- 
tatheoretischen Ebene durchaus einen solchen. Metatheoretisch findet sich der 
intentionale Gegenstand allerdings nicht darin, was der betreffende Text sagt, 
sondern woher er kommt. Das ähnelt wieder der arabischen Zeitung am Kiosk: Ich 
verstehe nicht, was sie sagt, sondern identifiziere ihren intentionalen Gegenstand 
als Text: Die Zeitung ist arabisch, nicht weil ich den Inhalt verstehe, sondern weil sie 
arabisch aussieht. 

Der Unterschied in diesem Vergleich besteht darin, dass ich bei der Zeitung 
unterstelle, dass sie textlich einen intentionalen Gegenstand hat - nämlich die Er- 
eignisse, über die sie berichtet, obwohl ich den Inhalt nicht verstehe. In der Me- 
tatheorie begegnet mir dagegen der KI-Text ohne textlichen intentionalen Gegen- 
stand, und zwar obwohl ich verstehen kann, was in dem Text steht. Was ich 
verstehe, ist aber dann meine textliche Interpretation des KI-Textes, jedoch keine 
Intention des „Autors“. 

Genauso ist mir der intentionale Gegenstand eines KI-Textes metatheoretisch 
gegeben, nicht textlich, sondern durch die Intentionalität der phänomenologischen 
Untersuchung. Die Phänomenologie erfasst den Text als Erscheinung der KI, und 
zwar durch die Art und Weise, wie dieser Text zustande gekommen ist. Der Text 
wird zwar als Text aufgefasst, aber er wird metatheoretisch nicht als Text gelesen. 
Das Textliche daran wird vielmehr phänomenologisch reduziert. In der Meta- 
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theorie interessiert nicht, was in dem Text steht, sondern welcher intentionale 
Gegenstand in ihm erscheint, nämlich seine Entstehung durch Künstliche Intelli- 
genz." 

Das trifft weitgehend auch auf die Texte zu, deren KI-Sprachmodelle nur als 
Werkzeug und Analysemittel für die Forschung eingesetzt werden. Denn die GPT- 
Technik bezieht sich zwar hier auf Texte und entwickelt einen Text über Texte, aber 
diese Ausgangstexte werden nicht textlich interpretiert. Erst die Forscherin inter- 
pretiert das Ergebnis dieses Werkzeugs. Was sie interpretiert, ist der Text als nicht- 
textlicher intentionaler Gegenstand. Erst sie lässt daraus einen Text entstehen. 
Deshalb wird metatheoretisch das Textliche des künstlich generierten Textes zu- 
nächst reduziert, bevor es durch die menschliche Interpretin schöpferisch in den 
Text hineingelesen wird. 

Die erste phänomenologische Reduktion hat den KI-Text textlich unglaubwür- 
dig gemacht. Deshalb verrät er metatheoretisch nichts dadurch, dass man ihn liest, 
sondern dass man hinter ihn schaut und auf seinen Entstehungsprozess achtet. 
Darin besteht die zweite phänomenologische Reduktion, die der Metatheorie. 

Nun gibt es eine hermeneutische Methode, die auch hinter die menschlich 
verfassten Texte schaut. Ich spreche von der Hermeneutik eines Schleiermachers 
oder Diltheys, die die Autorin in den Mittelpunkt ihres Verstehens rücken: Warum 
hat sie sich so ausgedrückt? Was war ihre Hintergrundmotivation, ihre textlichen 
Ressourcen, was ihre psychische Situation beim Abfassen des Textes?'® Wird nun 
etwa eine bestimmte hermeneutische Methode auch metatheoretisch bestimmend 
bei der Betrachtung von künstlich generierten Texten? Wird auch hier lediglich ein 
Spezialfall des Verstehens wichtig? 

Der Unterschied liegt darin, dass auch die Hermeneutik Diltheys und Schlei- 
ermachers ihre Fragestellung textlich untersucht. Das Erleben Diltheys zielt ja auf 
ein Allgemeinmenschliches, auf dessen Grundlage überhaupt nur die Inhalte der 
Verfasserin verständlich werden.'” Und Schleiermachers Methoden der Grammatik 
und Divination sollen ja den Gegenstand entdecken lassen. Sein berühmtes Diktum, 


17 Das ist in den Fällen anders, in denen gezeigt wird, was KI-Textgeneratoren falsch machen. Dann 
wird der intentionale Gegenstand des künstlich generierten Textes an diesem Text textlich unter- 
sucht. Wenn also gezeigt wird, dass ChatGPT weder richtig rechnen noch überhaupt verlässliche 
Ergebnisse ausspucken kann oder dass das Programm falsche Quellen erfindet (Clemens H. Cap, 
„Der neue Gott ist nackt! ChatGPT im Bildungswesen“, Forschung & Lehre, Bd. 30, 2023, 262-264), 
wird der Text textlich gelesen. Das heißt aber nicht, dass die intentionalen Gegenstände des Textes 
von Interesse sind. Vielmehr fungieren sie selbst nur als Erscheinungen des eigentlichen intentio- 
nalen Gegenstandes, nämlich von ChatGPT. 

18 Friedrich Schleiermacher, Hermeneutik und Kritik, Frankfurt a.M. ’1999, 81; Wilhelm Dilthey, 
Gesammelte Schriften, Bd. 7, Stuttgart 81992, 217. 

19 Dilthey 1992, 213. 
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„die Rede zuerst ebensogut und dann besser zu verstehen als ihr Urheber“? kann 
als einziges Vergleichskriterium nur den Gehalt des Textes haben. Dagegen bleibt 
die Intentionalität im KI-Text leer. Deshalb kann er auch nicht von der Rezipientin 
besser verstanden werden, als der Textgenerator versteht - einfach, weil er gar 
nicht versteht. Der Unterschied ist kategorial, weder graduell noch qualitativ. 

Metatheoretisch ist übrigens interessant, dass nicht am KI-Text selbst aufge- 
wiesen wird, dass seine Intentionalität leer ist, sondern an der Methode seines 
Zustandekommens. Insofern könnte man von einem zirkulären Verfahren spre- 
chen: Dass sich nicht am Text ein intentionaler Gegenstand zeigt, schließt das 
phänomenologische Verfahren von vornherein aus, weil es ihn nicht textlich un- 
tersucht. Es nimmt schon immer den Text von seinem Zustandekommen her in den 
Blick. Dahinter steht schon immer eine Hermeneutik des Verdachts. 

Kann dieser Zirkel durchbrochen werden? Die phänomenologische Methode 
durchschaut ja, dass der Text eine Täuschung ist, sobald er textlich gelesen wird. 
Durch seine Entstehungsart erscheint er als etwas anderes, als er als Text erscheint, 
nämlich als Zeichen für ein GPT-Modell. Der intentionale Gegenstand, der der 
Textgenerator ist, vernichtet den intentionalen Gegenstand innerhalb des Textes. 
Deshalb ist nicht das Verfahren zirkulär, sondern eine andere Erscheinung des 
Textes erzwingt nach der phänomenologischen Reduktion, dass der Text nicht 
textlich erscheint. 

Nach der phänomenologischen Reduktion erscheinen also Diskurse über LLM 
so, dass nicht textlich deren Texte thematisch werden. Wer dennoch ihre Textge- 
halte in den Blick nimmt, will dabei höchstens zeigen, dass die Texte nicht textlich 
zu verstehen sind — oder doch textlich, wie einige Technikoptimisten behaupten 
mögen. Aber in beiden Fällen müssten sie über die Texte hinausgehen und die 
Methode ihrer Generierung aufdecken. Wer mehr thematisieren will, nämlich auch, 
was diese Texte aussagen, also welchen intentionalen Gegenstand sie haben, müsste 
das an den Texten selbst ausweisen können. Dazu müssten sie aber anders er- 
scheinen, nämlich so, dass vernachlässigt werden kann, woher sie stammen. Das 
widerspricht aber ihrer Erscheinung, dass sie künstlich generierte Texte sind. 

In diesen Diskursen wird das Textliche von Texten überhaupt fraglich. Denn 
solange es keine textlichen Nachweise gibt, ob Texte künstlich generiert sind, bleibt 
zweifelhaft, ob sie einen intentionalen Gegenstand haben. Es könnte eben sein, dass 
ein bestimmter Text keine menschliche Verfasserin hat. Mögliche Zweifel will aber 
die Phänomenologie ausschalten. Eine Phänomenologie der Phänomenologie des 
Texterscheinens kommt daher an den Punkt, dass Texte in den entsprechenden 
Diskursen nur in ihrem Dass evident sind: dass sie Texte sind. Wissenschafts- 


20 Schleiermacher 1999, 94. 
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theoretisch wird der Fokus nun auf nicht-textliche Überprüfungsmethoden ge- 

richtet, dass ein Text textlich ist. Bevor man also überprüfen kann, ob Texte wahr 

sind, muss nun vorgeschaltet werden, dass sie überhaupt textlich behandelt werden 
dürfen. 

Ein Plagiat konnte man früher daran erkennen, dass man das Original fand und 
es mit dem Plagiatstext verglich. Plagiate sind ihrem Wesen nach nicht-textliche 
Texte, weil mit ihnen nichts gemeint ist, sondern nur das Meinen eines Originals 
wiederholt wird: Die Täuschung besteht also nicht im textlichen Geltungsanspruch, 
sondern in der verschleiernden Gestik der Plagiatorin, als ob mit dem Text schon 
ein Geltungsanspruch vorliegt. Aber wie überprüft man nun, ob ein Text textlich ist, 
wenn er zwar „abschreibt“, aber selbst das Original ist und trotzdem keinen in- 
tentionalen Gegenstand hat? Jedenfalls nicht so, dass man den betreffenden in- 
tentionalen Gegenstand findet! Denn damit wird er überhaupt erst erschaffen - so 
wie durch die Interpretin eines KI-Textes. 

Allein dass sich die Diskurse mit solchen Fragen jetzt beschäftigen, weist me- 
tatheoretisch darauf hin, wie Texte darin erscheinen. Wenn nämlich das Textliche 
von Texten abgelöst wird, bedarf es nicht-textlicher Überprüfungsmethoden, ob ein 
Text textlich zu lesen ist. Bevor man nicht-textliche Überprüfungsmethoden ansetzt, 
ob der Text die Wahrheit ausspricht, muss überprüft werden, ob er textlich ist. Und 
das Spannende ist: Es muss nicht-textlich überprüft werden, ob er textlich ist. 

Die große Herausforderung wird darin bestehen, ob sich solche nicht-textlichen 
Überprüfungsmethoden werden finden lassen, wenn allein der Text vorliegt. Gibt es 
also nicht-textliche Anhaltspunkte dafür, ob ein Text textlich zu lesen ist, im Text 
selbst? Das ist eine offene Frage der derzeitigen Diskurse um LLM. Phänomenolo- 
gisch gilt schon immer, dass man einen Text nicht textlich auffassen muss (das Kind, 
das Buchseiten herausreißt). Aber gibt es in Texten Anhaltspunkte, dass die Text- 
Erscheinung als nicht-textlich auftritt, dass also nicht derselbe Text sowohl so als 
auch so aufgefasst werden kann? Das ist dann der Fall, wenn der Text zu erkennen 
gibt, ob ihn ein Mensch verfasst hat oder eine Künstliche Intelligenz. 

Soweit ich sehe, werden hierzu zwei grundsätzliche Vorschläge angeboten: 

1. Die nicht-textliche Struktur eines KI-Textes ist transparent und nachvollziehbar 
- und zwar nicht nur für die Expertinnen des betreffenden Fachgebiets, zu dem 
der Text verfasst ist. 

2. Eine Künstliche Intelligenz selbst kann das spezifische Muster eines künstlich 
generierten Textes rekonstruieren. Wie sie aber auf ihr Ergebnis kommt, muss 
nicht transparent sein. 
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6.1 Transparente Nicht-Textlichkeit 


Sehen also künstlich generierte Texte anders aus als menschengemachte? Gibt es 
auffällige Strukturen, Redundanzen, Gedankensprünge, Auslassungen, Themen- 
verschiebungen? Lassen sich also qualitative Kriterien entdecken, die auf eine ka- 
tegorial andere Ebene der Intentionalität Rückschlüsse liefern? 

Nehmen wir an, in einer theologischen Lehrveranstaltung stellt die Dozentin 
die Hausaufgabe, den ontologischen Gottesbeweis von Anselm von Canterbury mit 
Kants Zurückweisung der Gottesbeweise zu vergleichen. Zur Aufgabe gehört auch 
eine begründete Stellungnahme, welcher Autor plausibler ist. Eine Studentin lässt 
die Aufgabe von ChatGPT schreiben. Kann die Dozentin die Täuschung am Text 
erkennen? Die Darstellung von Anselms und Kants Argumentation wird sachlich 
repräsentativ sein, weil das Datenmaterial für das Computerprogramm ausrei- 
chend umfangreich ist. Auch kritische Texte werden sich so künstlich verfassen 
lassen. 

Nehmen wir aber an, die Dozentin legt ihren Studierenden einen KI-gene- 
rierten Text zum Gottesbeweis vor, der zu kurz ist, um überzeugend zu sein, und 
einige fachliche Fehler in der Darstellung und Logik enthält. Die Aufgabe lautet nun, 
diese Fehler zu finden. Wird die KI die Fehler finden? Die Studentin verlässt sich auf 
ihren Textgenerator, der zwar ganz allgemein die Fragwürdigkeit von Gottesbe- 
weisen belegt, aber nicht konkret auf die vorliegenden Fehler reagiert. Dann wird 
die Dozentin die Arbeit als themenverfehlt bewerten. Dazu muss sie nicht nach- 
weisen, dass der Text künstlich erstellt worden ist. Vielmehr bescheinigt sie der 
Studentin, dass im Text der fragliche intentionale Gegenstand nicht behandelt 
worden ist. 

Ich lasse offen, ob sich Prüfungsaufgaben so eindeutig werden stellen lassen, 
dass die Bewertung ebenso eindeutig ausfällt, wie hier beschrieben. Das hängt 
davon ab, wie groß das Datenmaterial ist, um individuelle Aufgaben über bloße 
Wahrscheinlichkeitsunterstellungen zu bewältigen. Vielleicht hat die Studentin die 
Seminarsitzungen aufgenommen und damit ihr KI-Sprachmodell gefüttert, dass es 
sich für die Erwartungshorizonte der Dozentin trainieren konnte. Der Punkt ist hier 
nur:Wenn ein Textgenerator allein auf Wahrscheinlichkeitsmodellen aufbaut, kann 
er durch nicht-wahrscheinliche Aufgabenstellungen unterlaufen werden. Also muss 
sich am Text selbst überprüfen lassen, ob die Lösungen auf die Aufgabe bloß 
wahrscheinlich sind oder ob sie auf den individuellen Zusammenhang der Aufga- 
benstruktur konkret eingehen. Zumindest wenn die Nicht-Textlichkeit eines Textes 
transparent sein soll, wird unterstellt, dass es möglich ist, den Wahrscheinlich- 
keitsgenerator zu unterlaufen. 

Aber liest dann die Dozentin diesen Text nicht textlich, um ihn zu überprüfen? 
Muss sie nicht davon ausgehen, dass sich die künstliche Genese am Text textlich 
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zeigt? Dann entsteht ein Widerspruch: Der Text würde textlich ausweisen, dass er 
nicht-textlich ist, weil sein intentionaler Gegenstand leer ist. Der intentionale Ge- 
genstand des Textes wäre, dass er keinen hat. 

Hierbei handelt es sich aber um einen methodischen Widerspruch des indi- 
rekten Beweisverfahrens, nämlich das Textliche des Textes so lange zu unterstellen, 
bis der Widerspruch offengelegt ist. Anstelle des suggerierten intentionalen Ge- 
genstandes des Textes tritt der KI-Textgenerator als intentionaler Gegenstand auf, 
und zwar nicht textlich — weil im Text nicht über ihn die Rede ist —, sondern über 
die mangelhafte individuelle Herangehensweise. Die Dozentin trägt hypothetisch 
das Textliche in den Text ein, um es im Durchgang zu verwerfen. Sie vergleicht eine 
nicht-textliche Struktur des Textes mit der textlichen Struktur ihres Erwartungs- 
horizontes. Der Vergleichspunkt des Textlichen liegt außerhalb des befragten Tex- 
tes. Insofern ist er ein nicht-textliches Überprüfungskriterium, weil er außerhalb 
des Textes liegt. 


6.2 Überprüfung durch KI 


Wenn die Silbenfolge künstlich generierter Texte auf Wahrscheinlichkeiten beruht, 
müssten sich grundsätzlich die dabei entstehenden Muster rekonstruieren lassen, 
indem sie mit den Horizonten wahrscheinlicher Wortfolgen verglichen werden, die 
ein anderes Programm errechnet. Bei Plagiatskontrollprogrammen wird ähnlich 
verfahren. Der Unterschied liegt allerdings darin, wie der Vergleichstext gebildet 
wird: Bei Plagiatskontrollen liegen die Vergleichstexte vor und müssen nur in den 
Datenbanken aufgespürt werden. Bei einem künstlich generierten Text gibt es aber 
keinen Vergleichstext, sondern nur Wahrscheinlichkeitsunterstellungen, die das 
Programm selbst erhebt. Im Ergebnis würde also die Prüfung eine Prozentangabe 
von Übereinstimmungen zwischen dem vorliegenden Text und Wahrscheinlich- 
keitsunterstellungen angeben, die das Programm selbst vorgenommen hat. Dahin- 
ter liegt eine zirkuläre self-fulfilling prophecy: Ob der überprüfte Text intentional 
leer ist, erhebt ein Programm aufgrund der Kriterien, die es selbst entwickelt. Der 
Text gilt dann als künstlich oder menschlich generiert, weil allein das Kontroll- 
Programm die Wahrscheinlichkeit dafür bestimmen kann. Dabei bestimmt das 
Programm die Wahrscheinlichkeit nach denselben Methoden wie ein KI-Sprach- 
modell. Es wird dabei nicht den identischen Text geschrieben haben, ebenso wenig 
wie derselbe KI-Textgenerator dieselbe Aufgabe immer identisch löst. Gerade dar- 
um muss die Abweichungsbreite stochastisch bestimmt werden. Doch wie bestimmt 
man die Abweichungsbreite, wenn es kein transparentes Muster für Abweichungen 
gibt? Die Intransparenz ist ja eine Implikation des Vorschlags, dass eine KI den 
künstlich generierten Text aufspüren soll: Menschen würden das Muster nicht er- 
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kennen, und zwar selbst dann nicht, wenn Programmiererinnen sich auf ein sol- 
ches Muster geeinigt hätten (z.B. eine Abweichungsbreite der Wortfolgen von, sagen 
wir, 15 Prozent). Und Menschen könnten das Muster auch nicht erkennen, weil 
„Abweichungsbreite“ ein Konstrukt der Kl ist. Selbst wenn die KI ihre Ergebnisse in 
einem Protokoll transparent macht, ist nicht gesagt, dass die vom Kontrollpro- 
gramm erstellten Vergleichstexte ihre eigene Künstlichkeit definieren, also solche 
Vergleichstexte nur von einer KI geschrieben werden können. Wie soll die Dozentin 
einen Gedankengang mit mehreren anderen Formulierungen desselben Gedan- 
kengangs vergleichen und daraus folgern können, dass der Gedankengang nicht von 
der Studentin kommt? Und wie soll sie zu ihrem Urteil berechtigt sein, wenn die 
Vergleichstexte künstlich geschaffen worden sind, und das nur zu dem Zweck, einen 
künstlich generierten Text nachzuweisen? Dahinter liegt eine petitio principii. Das 
Überprüfungsprogramm suggeriert dabei nur Kriterien von Künstlichkeit. 

Wenn eine derartige Kontrollmethode anerkannt ist, setzen Menschen das 
Vertrauen in die KI-Überprüfung schon voraus, das erst durch die Methode ge- 
rechtfertigt werden soll. Damit wird sich die beschuldigte Studentin nicht zufrie- 
dengeben. Sie könnte immer noch darauf beharren, ihre Hausaufgabe selbst ver- 
fasst zu haben. Der Antwort der Dozentin, dass das Programm sie überführt habe, 
wiederholt den Zirkel, dass das Programm die Täuschung der Studentin ja nur 
deshalb überführt hat, weil die Dozentin den Kriterien vertraut, die sie selbst nicht 
kennt und die das Programm selbst aufgestellt hat. Dagegen könnte die Studentin 
vorbringen, dass das Programm die Vergleichstexte selbst erschafft, um sie 
durchfallen zu lassen. 


6.3 Konsequenzen für eine Phänomenologie der Diskurse über 
KI-Textgeneratoren 


In der Vorstellung, die KI könnte die Überprüfung vornehmen, ist bereits das 
menschliche Denken künstlich intelligent geworden. Es legt mit der Aufgabe auch 
schon die Lösung fest, nämlich dass mit der Delegation an die KI-Überprüfung die 
menschliche Kontrolle abgeschlossen ist und der menschliche Zugang zur KI- 
Überprüfung selbst ein unkontrollierter Zugang ist, eine Sache blinden Vertrauens. 
Dieser Trend zeigt sich nicht nur bei der Entwicklung von KI-Textgeneratoren. Er 
zeigt sich auch in anderen Bereichen der Maschinenethik, bei denen sich das 
menschliche Denken an die technischen Voraussetzungen anpasst. Dabei verändert 
sich das Verständnis von Ethik.” 


21 Lukas Ohly, „Wen soll das selbstfahrende Auto am Leben lassen? Digitale Transformationen der 
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Aber auch bei menschlich nachvollziehbaren transparenten Kriterien für 
künstlich generierte Texte geht der Trend dahin, am Text nicht-textliche Eigen- 
schaften aufzuweisen. Ob diese Versuche glücken werden, bleibt offen. Metatheo- 
retisch aber ist bedeutsam, dass die künstliche Herkunft von Texten zwar aus den 
Texten selbst rekonstruiert werden soll, dass aber deren Kriterien nicht-textlich 
sein sollen. 

In beiden Optionen erscheinen Texte also nicht nur textlich, und der Fokus 
wird gerade auf das Nicht-Textliche gelegt. Ob das Nicht-Textliche dabei schon 
hinreichend ist, um Kriterien für künstlich generierte Texte zu bilden, muss vorerst 
abgewartet und von weiteren interdisziplinären Forschungen überprüft werden. 
Diese Forschungen umfassen Heuristiken und empirische Überprüfungen. 


7 Wissenschaftstheoretische Folgerungen 


Was sagen nun diese Diskurse über ihr Wissenschaftsverständnis aus? Es ist eine 
Verunsicherung eingetreten, ob bestimmte wissenschaftliche Texte noch als wis- 
senschaftlich gelten können. Es fehlt das Zutrauen in die Wissenschaftlichkeit 
künstlich generierter Texte - trotz des zeitweiligen Vertrauens in KI-Kontrollpro- 
gramme, die als wissenschaftliche Werkzeuge eingesetzt werden. Neben den klas- 
sischen Wissenschaftskriterien der Intersubjektivität, Reliabilität (Reproduzier- 
barkeit”) und Validität scheinen damit auch unausgesprochene wissenschaftliche 
Implikationen auf, zum einen das Vertrauen, dass wissenschaftliche Texte täu- 
schungsfrei einen Beweisgang wiedergeben, der intentionale Gegenstände hat, und 
zum anderen die Originalität. 

Man könnte dem gegenüberstellen, dass die Reliabilität wissenschaftlicher 
Aussagen gerade durch zwar künstlich generierte, aber repräsentative Darstellun- 
gen bestätigt wird. Zwar können KI-Sprachmodelle noch nicht forschen. Aber sie 
können mit ihrer Methode Heuristiken finden, die im Erwartungshorizont von 
Wahrscheinlichkeiten liegen. Dasselbe trifft auf die Validität ihrer Texte zu: Zum 
einen können Textgeneratoren nur dann logische Fehler begehen, wenn diese 
wahrscheinlich sind - wenn sie also häufiger auch von Menschen begangen werden. 
Zum anderen lassen sich diese Fehler ihrerseits validieren. Problematisch an den 
klassischen Wissenschaftskriterien scheint daher lediglich das Intersubjektivitäts- 
kriterium zu sein. Denn erstens sind KI-Textgeneratoren keine Subjekte, sind also 


Ethik“, in Digitalisierung als Transformation? Perspektiven aus Ethik, Philosophie und Theologie, hg. 
von Tobias Holischka/Klaus Viertbauer/Christian Preidel, Berlin 2022, 99-117. 
22 Siehe hierzu den Beitrag von Thomas Arnold in diesem Band. 
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aus dem Forum der Wissenschaftsgemeinde ausgeschlossen. Zweitens aber sind 
auch menschengemachte wissenschaftliche Texte nur sehr eingeschränkt inter- 
subjektiv zugänglich, weil oft nur Leser mit Spezialwissen ihre Plausibilität ein- 
schätzen können. Solange eine einheitliche Wissenschaftsgemeinde künstlich ge- 
nerierte Texte ihres Spezialgebietes verstehen kann, bleibt das 
Intersubjektivitätskriterium erfüllt. Dazu muss der Textgenerator nicht selbst zu 
dieser Gemeinde gehören, selbst wenn er für sie Texte verfasst. Problematisch wird 
es, wenn Textgeneratoren ihrer Wissenschaftsgemeinde derart überlegen sind, dass 
ihre Texte gar nicht mehr verstanden werden. Ihre Aussagen könnten dann wahr 
sein, ohne dass sie dem Kriterium der Intersubjektivität Genüge tun. Sie können 
dann nicht mehr als wissenschaftlich gelten, und zwar selbst dann nicht, wenn sie 
reliabel und valide sind. 

Solange dieses letzte Szenario der Überlegenheit nicht eingetreten ist, können 
künstlich generierte Texte zumindest im beschränkten Rahmen als wissenschaftlich 
gelten und damit ihre Generatoren als wissenschaftlich nützliche Tools. Ebenso wie 
jeder wissenschaftliche Text auf sein Thema und seine Methodik beschränkt ist, 
sind auch die Ansprüche künstlich generierter Texte rahmenrelativ. In den Dis- 
kursen über die Gefährdung der Wissenschaft durch Sprachmodelle spielen daher 
zunehmend weitere Wissenschaftskriterien eine Rolle, die bislang implizit waren. 

Bislang hatte man stillschweigend darauf vertraut, dass der Text einen inten- 
tionalen Gegenstand hat. Künftig werden Kontrollen durchlaufen werden müssen, 
damit nicht künstlich generierte „Leerintentionen“ weitergetragen werden, die 
zwar scheinbar interessante Aussagen treffen, aber über nichts. Diese Kontrollen 
können sich aber nicht nur darin erschöpfen, nachzuweisen, dass der jeweilige 
geprüfte Text künstlich generiert worden ist. Vielmehr muss auch überprüft wer- 
den, ob man dennoch in ihn wissenschaftlich gesichert (intersubjektiv, reliabel, 
valide) einen intentionalen Gegenstand „hineinlesen“ kann. Als wissenschaftliches 
Werkzeug können KI-Textgeneratoren trotz Leerintentionen dienen, wenn man sie 
geschickt einsetzt. 

Das zweite implizite Kriterium scheint mir nicht selbstverständlich zu gelten, 
nämlich das der Originalität. Kann eine Theorie nur dann als wissenschaftlich 
gelten, wenn sie zum Zeitpunkt ihrer Entstehung eine neue Erkenntnis hervorge- 
bracht hat? Und können dann allenfalls Menschen der Wissenschaft fähig sein? Ist 
also die unvertretbare Urheberschaft ein implizites Wissenschaftskriterium? 

Wenn sie das ist, dann war sie es noch nicht zu allen Zeiten. Zum Ersten ging es 
dem antiken, etwa dem aristotelischen, Wissenschaftsverständnis um die Aufde- 
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ckung des Allgemeinen.” Wenn die Wissenschaft den Grund für etwas Einzelnes 
aufdeckt, so deckt sie etwas Allgemeines auf. Darum ist Wissenschaft auch lehrbar. 
Dabei spielt der individuelle Moment der Aufdeckung keine Rolle. Denn sonst wäre 
Wissenschaft selbst etwas Einzelnes und nichts Allgemeines. 

Zum Zweiten tendiert gerade die moderne Wissenschaft zu methodischen 
Normen, „die lediglich der Beherrschung empirischer Daten verpflichtet sind.“”* In 
diesen Kontext des technisch-wissenschaftlichen Verfügungswissens reihen sich 
auch LLM ein. Künstliche Intelligenz verfügt selbst über ein umfangreiches Da- 
tenmaterial und kann mit ihm neue Daten generieren. 

Zum Dritten rückt inzwischen die individuelle Originalität in den Hintergrund, 
wenn Forscherteams Texte veröffentlichen, bei denen die spezifische Mitwirkung 
der einzelnen Autorinnen nicht detailliert beschrieben wird, sondern nur die Rei- 
henfolge ihrer Nennung einen Hinweis gibt. Damit wird mitunter auch über die 
wahre Urheberschaft getäuscht, etwa wenn die Doktormutter im Autorinnenteam 
mit aufgeführt wird, obwohl sich ihr Beitrag am Artikel ausschließlich darauf re- 
duziert, Doktormutter zu sein. Die Namen sagen nichts über die Unvertretbarkeit 
aus, sondern über die Verantwortlichkeit für den Artikel. Die Verantwortung dafür 
kann aber auch jemand übernehmen, der ihn nicht selbst verfasst hat. Dann aber 
spielt nicht Originalität oder gar genialische Virtuosität die entscheidende Rolle für 
die wissenschaftliche Verantwortung, sondern die Berufung auf die Rolle, für die 
entsprechende Position einzustehen.”° 

Aber selbst wenn man Originalität in den Vordergrund stellt, wäre dies ver- 
mutlich nur eine vorübergehende Lösung. KI-Sprachmodelle werden schon mit 
ihren bestehenden Wahrscheinlichkeitsannahmen originelle Heuristiken entwi- 
ckeln, die trotz ihrer Leerintentionen hilfreiche Anstöße geben werden. So wie 
schon heute neue fiktive Erzählungen künstlich generiert werden können, stehen 
auch neue wissenschaftliche Verallgemeinerungen im Horizont der Künstlichen 
Intelligenz. 

Hinter der Suche nach neuen Wissenschaftskriterien zeigt sich metatheoretisch 
eine Apologie des Menschen. Die angebliche Disruption von Wissenschaft ist letzt- 
lich in der Anthropologie lokalisiert: Hat der Mensch eine Sonderstellung, Wis- 
senschaft zu betreiben? Wenn Ja: Worin besteht sie? Wenn Nein: Wird der Status 
des Menschen durch Künstliche Intelligenz bedroht? Mir scheint jedoch, dass zwi- 
schen der fehlenden Sonderstellung des Menschen und einer potenziellen Bedro- 


23 Aristoteles, Metaphysik. Erster Halbband: Bücher I (A) - VI (E), hg. von Horst Seidl; griech. Text hg. 
von W. Christ, Hamburg *1989. 

24 Friedrich Kambartel, „Wissenschaft“, in Enzyklopädie Philosophie und Wissenschaftstheorie, 
Bd. 4, hg. von Jürgen Mittelstraß, Stuttgart, Weimar 1996, 719-721, 720. 

25 Lukas Ohly/Catharina Wellhöfer, Ethik im Cyberspace, Frankfurt a.M. 2017, 110-111. 
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hung durch KI kein direkter Zusammenhang besteht. Denn KI besitzt weder in- 
tentionale Gegenstände noch eine Lebenswelt,”° die sie in Konkurrenz zum Men- 
schen setzen könnte. 


26 Bernhard Irrgang, Posthumanes Menschsein? Künstliche Intelligenz, Cyberspace, Roboter, Cy- 
borgs und Designer-Menschen — Anthropologie des künstlichen Menschen im 21. Jahrhundert, 
Wiesbaden/Stuttgart 2005, 138. 
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Hermeneutische Überlegungen zu KlI-generierten Texten 


Abstract: The validity of texts lies, among other things, in the meaning they convey 
to people. To grasp this meaning, humans rely on understanding. In this article, I 
explore whether Al-generated texts have the same character as those written by 
humans. For example, what is the role of the fact that AI texts do not have a subject 
embedded in the lifeworld, but generate their content based on syntactic proba- 
bility? I aim to show that the concept of understanding is not adequate for text 
generators because, according to Heidegger, understanding involves a practical 
engagement with the „world“. Finally, I outline some speculative scenarios of what 
AI texts might mean for humans and their sense of self. 


1 Einleitung 


Wenn man die Frage aufwirft, welche Geltung Texte für Menschen haben, so kann 
die Antwort darauf nicht davon absehen, von wem die Texte geschrieben wurden 
und wer sie konkret liest. Eine Gesellschaft gibt sich mehr oder weniger eine 
wertende Struktur darüber, welche Texte und AutorInnen für sie von Bedeutung 
sind, d.h. auch in den Bildungskanon gehören. Texte wie die Bibel oder Autoren wie 
Kant haben in den westeuropäischen Gesellschaften einen herausragenden Stel- 
lenwert und somit Geltungsanspruch. Natürlich ist diese Geltung nicht in Stein 
gemeißelt und unterliegt den Wogen und Interessen der Zeit. 

Blickt man nun auf das neue Phänomen von Texten der Textgeneratoren — neu 
daher, weil der Massenzugang erst kürzlich erfolgt ist -, so kann man hier die 
analoge Frage nach dem Urheber des Textes ebenso wie nach dem Rezipienten 
stellen. Von den vielfältigen sonstigen Aspekten, die einem Text Geltung verleihen, 
soll diese Korrelation hier ausgewählt und diskutiert werden. Der Fokus liegt zu- 
gleich auf wissenschaftlichen sowie literarischen und nicht auf informationsver- 
mittelnden Texten. Es soll mithin an prompts der Kategorie „Schreibe mir einen 
Essay über ... der aktiven Sterbehilfe“ gedacht werden und nicht an: „Erstelle mir 
eine Liste der zehn größten Städte in Hessen“. Erster prompt thematisiert einen 
Sinnzusammenhang der Orientierung, während der zweite nur einen Informati- 
onsinhalt ausgibt. Ich stelle die Geltung dieser Texte in den Rahmen des mensch- 
lichen Verstehens, indem ich das Verstehen im Hinblick auf Urheber und Rezipient 
hermeneutisch beleuchte. Es ist gerade das Verstehen, das sich aufgrund der 


8 Open Access. © 2024 bei den Autorinnen und Autoren, publiziert von De Gruyter. Dieses Werk ist 
lizenziert unter einer Creative Commons Namensnennung - Nicht kommerziell - Keine Bearbeitung 4.0 International 
Lizenz. https:/doi.org/10.1515/9783111351490-016 
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Fremdartigkeit des Urhebers von KI-Texten transformiert und einer besonderen 
Reflexion bedarf. Das menschliche Verstehen von KI-Texten verändert sich deshalb, 
weil diese Texte anders ‚hergestellt‘ werden als menschliche Texte und weil KI-Texte 
einen grundsätzlich anderen Charakter aufweisen, nämlich einen Charakter der 
Anonymität, da sie von niemanden geschrieben werden. Diese Anonymität birgt 
Probleme für das Verstehen. Um das zu zeigen, werde ich mich auf die Hermeneutik 
und das Prinzip des hermeneutischen Zirkels beziehen, wie sie u.a. von Heidegger 
reflektiert wurden. Die Pointe von Heideggers Verstehensbegriff liegt darin, dass 
dieser im Erleben und Erfahren einer Lebenspraxis gründet und diese Praxis ver- 
stehend das übrige Verstehen fundiert. So erscheint für Heidegger „Welt“ immer als 
Einbettung einer Praxis mit Dingen; „Welt“ begegnet zugleich mit zur-Hand-seien- 
dem Zeug." Eine solche Lebenswelt des praktischen Umgangs fehlt aber der KI und 
ihren Texten, sodass man vielleicht zu der radikalen These kommen könnte, dass es 
in diesen Texten nichts zu verstehen gibt, weil niemand sie schreibt. Das ist freilich 
überspitzt; denn dass Menschen die KI-Texte nicht verstehen, wird keiner ernstlich 
behaupten, auch nicht, dass solche Texte das Selbstverstehen des Menschen ver- 
neinen. Dennoch kann es nicht unbeachtet bleiben, dass KI-Texte durch eine se- 
mantisch-syntaktischen Synthese anderer, oft menschlicher Texte hergestellt wer- 
den, sich aber keine konkrete menschliche Existenz hinter ihnen verbirgt und sie 
daher ohne einen ‚Sitz im Leben‘ (/Lebenswelt) verfasst sind. Diese Beobachtung 
bilden den Horizont folgender Auseinandersetzung um den Begriff des Verstehens 
von Texten. 

Ich gehe dabei so vor, dass ich zuerst den Verstehensbegriff bei Heidegger 
kursorisch rekapituliere und sodann auf den hermeneutischen Zirkel menschlichen 
Verstehens aufmerksam mache. Ausgehend davon diskutiere ich die Differenzen im 
Verstehen von KI-Texten und das Verstehen durch KI-Tools. Ich frage also nach den 
Neuerungen und Risiken, die sich für unser Selbstverstehen und Sein ergeben, 
wenn wir zunehmend KI-Texte in unsere Lebenswelt einbetten. Konkret will ich 
diese Risiken an zwei Phänomenen aufweisen, namentlich der digitalen Halluzi- 
nation und einer hermeneutisch reduzierten Überfülle. Letzteres deutet eine Para- 
doxie an. Zum Schluss gehe ich stärker spekulativ darauf ein, was es für Menschen 
und ihr Selbstverstehen bedeuten kann, wenn sie ihre Schreibfähigkeit an KIs de- 


1 Das macht Heidegger in $18 von Sein und Zeit, 83-84. deutlich: „Welt ist in allem Zuhandenen 
immer schon ‚da‘. Welt ist vorgängig mit allem Begegnenden schon, obzwar unthematisch, ent- 
deckt.“ „Seiendes ist darauf entdeckt, daß es als dieses Seiende, das es ist, auf etwas verwiesen ist. Es 
hat mit ihm bei etwas sein Bewenden. Der Seinscharakter des Zuhandenen ist die Bewandtnis.“ „Das 
Wobei es die Bewandtnis hat, ist das Wozu der Dienlichkeit, das Wofür der Verwendbarkeit.“ — also 
der Praxis. Martin Heidegger, Sein und Zeit, Tübingen 2006, 83-84. 


Wenn Niemand Texte schreibt —- 259 


legieren, bzw. wenn sie sich vorwiegend mit KI-Texten, die von niemanden ge- 
schrieben sind, umgeben. Ich beginne mit dem Begriff des Verstehens. 


2 Wie Menschen verstehen 


Wenn Menschen etwas verstehen, so steht nicht das Kennenlernen von Informa- 
tionen im Vordergrund der Verstehensleistung. Lerne ich etwa, dass Luther an- 
geblich 1517 Zettel an eine Kirchentür gehämmert hat, habe ich zwar etwas gelernt, 
aber wohl noch nichts verstanden. Verstehen hat etwas mit Sinn zu tun, nämlich 
den Sinn, den ein Wissen/Information für das eigene Leben/Existenz hat: 


Verstehen zielt auf das Erfassen von Sinn, Sinn ist das, was verstanden werden kann, und weil 
es Sinn nur „in Bezug zum Nicht-Sinn, zum Anderen des Sinns“ gibt, also im Zusammenhang 
von Zeichenprozessen, in denen diese Differenz virulent wird, kann auch Verstehen nur im 
Horizont von Zeichenprozessen verstanden werden. Ganz allgemein lässt sich Verstehen daher 
als kreativer „Prozess des Herausarbeitens, des Verwandelns von Unbestimmtem in Be- 
stimmtes“ beschreiben.” 


Weil Zeichen (sowie Gesten, Worte, Verhalten, Texte) interpretiert werden, gibt es 
immer mehrere Möglichkeiten der Interpretation, je nach Kontext, Ort, Zeit, Subjekt 
und Objekt. Sinn beschreibt dabei die treffendste, aber keineswegs die einzige In- 
terpretation für das eigene Leben; und die Überführung von Zeichen in sinnvolle 
Zeichen beschreibt den Prozess des Verstehens. Nun ist aber dieser Prozess des 
Verstehens selbst ein Vollzug eines Subjektes, das in einer Welt von Zeichen lebt, 
also Gesten, Texte und Verhalten irgendwie schon kennen muss, um verstehen zu 
können. Das Überführen von Unbestimmtem in Bestimmtes geschieht also auf der 
Basis eines Vorher-irgendwie-schon-verstanden-Habens. Genau diesen Sachverhalt, 
dass das (theoretische) Verstehen auf einem anderen Verstehen fußt, hatte Hei- 
degger programmatisch gezeigt. Er thematisierte dabei das Verstehen als Struk- 
turmoment des In-Seins des Menschen (in einer Situation der Praxis sein).” Wenn 
Menschen mit Dingen umgehen, so tun sie es sehr häufig sinnvoll und damit ver- 
stehend, aber dieser Umgang selbst ist sehr oft gar nicht bewusst und kein Erfassen 
der Praxis-Sache und der Dinge als solche: 


2 Ingolf Dalferth, Kunst des Verstehens. Grundzüge einer Hermeneutik der Kommunikation durch 
Texte, Tübingen 2018, 21; Vgl. zur ausführlichen Darstellung des Verstehensbegriffs auch Oliver R. 
Scholz, Verstehen und Rationalität. Untersuchung zu den Grundlagen von Hermeneutik und 
Sprachphilosophie, Frankfurt a.M. 2016. 

3 Vgl. Csaba Olay, „Verstehen und Auslegung beim frühen Heidegger“, in Verstehen nach Heidegger 
und Brandom, hg. von Barbara Merker, Hamburg 2009, 47-60, 49. 
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In dem Erlebnis des [Gegenstand]sehens gibt sich mir etwas aus einer unmittelbaren Umwelt. 
Dieses Umweltliche [...] sind nicht Sachen mit einem bestimmten Bedeutungscharakter, Ge- 
genstände, und dazu noch aufgefaßt als das und das bedeutend, sondern das Bedeutsame ist 


das Primäre, gibt sich mir unmittelbar, ohne jeden gedanklichen Umweg über ein Sacherfas- 


sen." 


Das soll heißen, dass unsere gewöhnliche Vorstellung davon, wie Menschen Objekte 
als etwas (bspw. Auto) erkennen - eine Vorstellung, die wir auch in das maschinelle 
Erkennen übertragen - eine Täuschung dahingehend ist, dass sie sekundär eine 
Erkenntnistheorie postuliert, die am primären Erleben vorbeigeht. Heidegger will 
sagen: unser Sehen sieht nicht zuerst ein unidentifiziertes Objektding, das sodann 
durch den Verstand mit Inhalten und Bedeutungen beladen wird, sodass wir er- 
kennen: ein Auto. Sondern Heidegger kehrt das Erkennen um, indem er auf eine 
unmittelbare Umweltlichkeit abhebt, soll heißen: Beim Sehen eines Objektes ist 
dieses Objekt je und je schon eingebettet in Zusammenhänge, sodass das Auto nur 
und je schon als Auto erscheint, da es auf der Straße mir entgegenkommend ge- 
sehen wird. Ich sehe nicht Ding und dann Auto, sondern: Auto, weil eingebettet in 
Verkehr, mir entgegenkommend, auf der Straße, usw, usw. Bedeutung gibt sich und 
nicht unidentifizierbare Etwasse (Empfindungsdaten). Das aber heißt, dass unsere 
Konstruktion und Programmierung von sensorischer Identifikation grundsätzlich 
eine abgeleitete Interpretation und Theoriebildung menschlichen Seins ist. Gerade 
weil es ganz unmöglich ist, maschinelle Bedeutungswahrnehmung in Analogie zum 
Dasein zu konstruieren, konstruieren wir nur Ableitungen, die aber im Resultat 
durchaus übereinstimmen und so den Eindruck erwecken, als sei auch die primäre 
Verstehensleistung identisch. Die Unmöglichkeit einer Analogiebildung übrigens 
wurzelt darin, dass es gerade nicht unser Sein ist, das Bedeutung herstellt, sondern 
— wie Heidegger richtig sagt und die neue Phänomenologie in Frankreich weiter 
entfaltet hat? - sich diese Bedeutung mir gibt. Phänomene wurzeln in der (Selbst-) 
Gabe und sind nicht Verstandeskonstrukte übertragen auf unidentifizierbare Ob- 
jekte. Man könnte auch sagen: für uns Menschen gibt es schlicht gar keine un- 
identifizierbaren Objekte, sondern nur bedeutsame Dinge (Heidegger nennt sie 
dann Zeug, HermeneutikerInnen nennen sie Zeichen‘). 

Stellen wir ausnahmsweise mal fest, dass wir ein Objekt tatsächlich nicht zu- 
ordnen können, es also nicht identifizieren, dann liegt es daran, dass es ohne Be- 
deutung erscheint, das aber heißt: ohne Kontext und Welt, auf das es je und je 


4 Martin Heidegger, „Die Idee der Philosophie und das Weltanschauungsproblem“, in Gesamtaus- 
gabe 2 Abteilung: Vorlesungen, Bd. 56/57, Frankfurt a.M. 1999, 72-73; Vgl. Olay 2009, 50-51. 

5 Vgl. Jean-Luc Marion, Gegeben sei. Entwurf einer Phänomenologie der Gegebenheit, Freiburg 2015. 
6 Vgl. Dalferth 2018. 


Wenn Niemand Texte schreibt —— 261 


bezogen ist (das ist die Bewandtnis und damit Welt als Ganzheit der Bewandtnis). 
An ein solches Objekt gäbe es grundsätzlich zwei Herangehensweisen, wie es ver- 
standen (das aber heißt: bedeutsam) werden kann: über den theoretischen Schluss 
oder über die Praxis der Zuhandenheit. Zuerst soll das theoretische Schließen am 
Beispiel von Hieroglyphen verdeutlicht werden: diese erschienen uns bis zum Fund 
des Steins von Rosette in einer Hinsicht ohne Kontext und Welt, nämlich ohne 
sprachlichen Übersetzungskontext. Sie erschienen immer schon als Symbole oder 
(sprachliche) Bilder, weil diese Bedeutung von Symbolen durch unseren Alltag je 
erschlossen ist - daher waren auch Hieroglyphe im Kontext der Sprach-Welt ver- 
ortet und nie völlig unverstanden; schließlich hat man verstanden, dass es jeman- 
den gab, für den die Symbole etwas bedeuten. Aber die Bedeutung der einzelnen 
Symbole war weltfrei und ohne Übersetzungskontext. Erst der Stein von Rosette 
eröffnete einen theoretischen Schluss auf eine Welt, nämlich einen Horizont, in den 
hinein die einzelnen Symbole eingeordnet werden konnten. Das aber sind explizite 
Verstandesleistungen des theoretischen Vermögens - und ein Stückweit funktio- 
niert das maschinelle Lernen analog zu diesem theoretischen, sekundären Schluss. 
Vor allem liegt in diesem Zugang zu einem Gegenstand die Analogie zum Textver- 
stehen: Wir verstehen Texte insofern theoretisch, als wir ihren Sinn in der Reflexion 
thematisch werden lassen und Verknüpfungen herstellen. In der Reflexion sind wir 
aber aus der lebendigen Praxis herausgetreten und ‚bei uns‘, wir trennen also 
Gegenstand und Erkenntnis.” Was jedoch nicht übersehen werden darf, ist das 
Fundament dieser Reflexionsleistung, namentlich dass dieses Verstehen in einem 
Vorverständnis wurzelt, das selbst durch die Praxis des Lebens erschlossen worden 
ist. 

Das Zweite ist diese unsere Praxis der ‚Zuhandenheit‘, in der wir verstehend 
Welt erschließen. Dafür ist das Beispiel der Türklinke recht naheliegend. Das Ver- 
stehen oder Lernen der Türklinke geschieht ja nicht über eine theoretische Er- 
schließung eines Dinges als Klinke. Sondern die Klinke wird je und je als solche in 
ihrer Anwendung kennengelernt, d.h. nur in der Praxis des Drückens und Türöff- 
nens lernen Menschen leiblich, wie das Ding ‚Klinke‘ benutzt wird und mithin was 
sie ‚ist‘. Sie ist das, was sie in ihrer Funktion tut, und sie tut es, ohne den ‚Umweg‘, 
wie Heidegger sagt, über den theoretischen Schluss zu nehmen. Man könnte hier 
auf das Lernen von Kindern verweisen: diese sitzen ja nicht da und wälzen Bücher, 
in denen steht: Ding = Klinke = Türöffner. Sondern Kinder lernen die Klinke in ihrer 
weltlichen Benutzung kennen, als das Ding, das die Mutter drückt, um in die Küche 


7 Ich folge der treffenden Definition von Reflexion von Hans Wagner, die er in Anlehnung an 
Heidegger gegeben hat: „Dieses Beisichsein im Modus der Rückkehr aus dem Außersichsein nennen 
wir Reflexion.“ Hans Wagner, Philosophie und Reflexion, München 1980, 36. 
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zu gehen; ihre Funktion ist ihr Sein, und verstanden ist das Ding im Gedrücktwerden 
und nicht im theoretischen Wissen um ein Wozu. Das meint Heidegger mit ‚Zu- 
handenheit‘. Und diese stellt als Fundament unser Vorwissen und Vorverständnis 
dar, auf dessen Grundlage dann Textverstehen stattfindet, weil alles propositionale 
Wissen auf einem praktischen Verstehen basiert: „Propositionales explizites Ver- 
stehen [Reden über das Objekt] gründet auf praktisch explizitem Verstehen. Anders 
gesagt: dem praktischen Verstehen gebührt der Primat vor dem propositionalen 
Verstehen.“ Texte verstehen oder sie auch interpretieren, können Menschen nur, 
weil sie das, was sie darin lesen, vorverstanden haben. Kants transzendentale Äs- 
thetik kann man nur dann verstehen, wenn man die Worte im Text schon vorver- 
standen hat - und die Ästhetik interpretieren/deuten kann man erst dann, wenn 
man sie verstanden hat. „Weil wir schon verstehen, können wir interpretie- 
ren [...].“ Das aber heißt, dass das menschliche Verstehen zirkulär ist: Jedes Ver- 
stehen ist fundiert in einem Vorverständnis, das das Verstandene (und zugleich 
damit das Vorverständnis) erschließen muss. Sobald das Vorverständnis explizit 
gemacht wird, wird es als Verstandenes auch konstruiert. Das so kreativ Er- 
schlossene/Verstandene (das jedoch wie jedes Verstehen, zirkulär, in einem Vor- 
verständnis wurzelt) wird wiederum zum Vorverständnis neuen Verstehens, usw. 
Es scheint mithin so, dass die Hebung des Vorverständnisses ins explizite Be- 
wusstsein Ersteres aus seiner Einbettung in die Lebenspraxis herausholt und es auf 
die Ebene der Informationen bringt. Auf dieser Ebene ist das Verstehen dann auch 
für die KI möglich - allerdings würde Heidegger sagen, dass dies eben kein Ver- 
stehen ist. Das Vorverständnis ist bedingt durch unsere Sprache, Kultur, Zeitgeist 
und unendlich vielem mehr. Es unterliegt aber auch Machtinteressen, einer Moral 
oder Religion; es lässt sich durch Ideologie eingrenzen und strukturieren, insofern 
Ideologie, wie Marx sagt, ein falsches Bewusstsein (falsches Verstehen) ist. Wird das 
falsche Bewusstsein forciert, wird auch das Vorverständnis entsprechend begrenzt. 
Und die Kräfte der Begrenzung (Ideologisierung) und der Öffnung (Aufklärung) 
durchziehen als Polaritäten die menschliche Geschichte seit jeher. Genau diese 
Spannung aus Begrenzung und Öffnung des Vorverständnisses lässt sich m. E. auch 
im Umgang mit KI-Tools postulieren. 


8 Christoph Demmerling, „Implizit und Explizit. Überlegungen zum Verstehensbegriff im Anschluss 
Heidegger und Brandom“, in Verstehen nach Heidegger und Brandom, hg. von Barbara Merker, 
Hamburg 2009, 61-78, 67. 

9 Wolf-Jürgen Cramm, „Zum Verhältnis von symbolbezogenen und nicht-symbolbezogenen Formen 
des Verstehens“, in Verstehen nach Heidegger und Brandom, hg. von Barbara Merker, Hamburg 2009, 
165-190, 168. 
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3 Das Verstehen von KI-Texten 


KI-Tools!® haben sehr oft den Zweck, Informationen zu komprimieren, zusam- 
menzufassen, einen Text so zu generieren, dass er menschlich wirkt, allemal ver- 
ständlich und klar. Auch menschliche Texte haben diese Tendenz, wurzeln aber in 
einer genuinen, individuellen Sprache, die manchmal sperrig oder historisch ver- 
altet wirkt, wenn man bspw. an Kants Vernunftschrift(en) denkt. Während das 
menschliche Verfassen von Texten und ihre Rezeption oft darauf abzielen, den 
Welthorizont - über die bloße Informationsvermittlung hinaus - zu erweitern," 
weil u.a. der Kontext des Verstehens durch die Auseinandersetzung mit einem Text 
ausgeweitet wird, tendiert die Rezeption von KI generierte Texten sowie das daraus 
resultierende Verstehen — so meine These — dazu, den Welthorizont durch Infor- 
mationen zu verengen, bzw. zuzuspitzen. Folgendes Beispiel soll dies verdeutlichen: 
Der Abfassung von Kants Kritik der reinen Vernunft lag die Intention zu Grunde, den 
Diskurs der Vernunft zu erweitern, zu korrigieren und aufzuklären. Der Autor 
wollte möglichst gut, detailliert und in der Breite einen Sachverhalt entfalten. Mit 
dieser Intention ist der Lesende konfrontiert und es kann sich in/nach der Lektüre 
die Möglichkeit eines umfassenden Verstehens im Sinne gewandelter Lebenspraxis 
einstellen — oder auch nicht. Jedenfalls ist die Möglichkeit eines Könnens darin 
gegeben. Indem ich einen Text lese und insofern ich ihn verstehe, geht damit einher, 
dass mein Können und mein Leben erweitert wird: Ich werde bspw. in Bezug auf die 
Vernunft verstehend, d.h. hier nicht nur sprachfähig, ihre diskursive und reelle 
Breite als Information zu benennen, also Auskunft zu geben darüber, was mir 
vorher unverstanden und sinnlos war, sondern es besteht die Möglichkeit, in mei- 
ner Existenz die Praxis der Vernunft (als einen existentiellen Vollzug) zu etablieren. 
So könnte ich nicht nur sagen, was Kants Schrift für den Gottesgedanken, als In- 
formation, bedeutet, sondern es besteht die existentielle Möglichkeit, mein Gottes- 
sowie Selbst- und Weltbild verstehend zu ändern. Darüber hinaus werde ich be- 
fähigt, die Vernunft gemäß ihren Grenzen korrekt zu nutzen. Jedes Verstehen geht 
damit einher, zuerst das menschliche Sein in seinem Sein-Können zu erhellen (denn 
beim Verstehen geht es primär um Sinn und nur sekundär um Informationen), 


10 Der Fokus liegt hier auf den neueren Sprachmodellen, insbesondere dem Generative Pre-trained 
Transformer (GPT). Zu deren Funktionsweise vgl. Gokul Yenduri et al., Generative Pre-trained 
Transformer: A Comprehensive Review on Enabling Technologies, Potential Applications, Emerging 
Challenges, and Future Directions, ArXiv 2023, 1-40, 7, in [www.doi.org/10.48550/arXiv.2305.10435] 
(Zugriff: 26.09.2023). 

11 Das gilt fur viele, aber sicher nicht fiir alle menschlichen Texte. Das trifft etwa auf Marchen, 
Romane oder auch Forschungsliteratur zu, weniger aber auf Lexika u.ä. 
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sodass der Mensch im Verstehen als ein könnendes Wesen sichtbar wird, sodann 
aber auch die Fähigkeit in Bezug auf das Verstandene im Können/Praxis zu er- 
weitern.'” Das Können hat daher zuerst den Charakter eines Potentials, es muss 
nicht thematisch sein oder als Tatsache beschrieben werden können. Als Potential 
ermöglicht es, das Verstandene wiederum als Ausgangspunkt für kreative Entfal- 
tung zu nutzen, etwa dann, wenn Kants Schrift einen inspiriert, einen Essay über 
ein angrenzendes Thema zu schreiben. Das bedeutet nicht, dass hier eine Infor- 
mationsbasis bereit liegt, um daraus Neues herzustellen. Das Verstandene ist, als 
sinnvolle Lebenspraxis, nicht thematisch und explizit, sondern in „Welt“ einge- 
bettet. 

Je breiter das Verstandene im Text-Verstehen erschlossen wurde, desto po- 
tentieller und auch unthematischer fundiert es das Befähigtsein für zukünftiges 
thematische Planen von zum Beispiel Projekten.'” Verstehe ich hingegen nur 
Bruchstücke eines Textes, weil mir nur diese als Information präsentiert werden, ist 
mein Verstehen in seiner Potentialität genau auf diese Anteile reduziert. Natürlich 
wird man dadurch nicht etwa die Möglichkeit einer Könnens-Erweiterung qua KI- 
Texte absprechen dürfen. Das Verstehen als solches kann nicht unterbunden wer- 
den. Aber das Potential kann dennoch gemindert werden, da KI generierten Texte, 
u.a. weil ihr Ziel in der Komprimierung von Informationen besteht, als Verkür- 
zungen der menschlichen Texte erscheinen, sowie vom Kontext und Geschichte 
entrissen und d.h. ohne Lebenswelt sind. KI-Texte scheinen damit tendenziell den 
begrenzenden Pol zu forcieren, während menschliche Texte oft (aber keineswegs 
immer) den öffnenden Pol bedienen. Das diese Tendenz in den KI-Texten plausibel 
ist, will ich im Folgenden stärker entfalten. 


4 Verstehen durch Texte und Verstehen durch 
KI-Tools - zwei Problemkreise 


Es gibt eine Menge an Problemen, die im Zusammenhang mit KI und Textgenera- 
toren diskutabel wären: Angefangen mit juristischen Fragen des Urheberrechts bis 
hin zu medienethischen Fragen zum Umgang mit Fake News. Geleitet durch meine 
Fragestellung will ich die Textgeltung und die Texthermeneutik in den Fokus rücken 
und zwei Problemkreise beschreiben: A) Das Problem der ‚Halluzination‘ von 
Textgeneratoren und B) die hermeneutisch reduzierte Überfülle. Beides bedarf ei- 


12 Vgl. Heidegger 2006, 831. 
13 Vgl. Olay 2009, 56. 
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ner Explikation und beides soll den reduzierenden Charakter von KI-Texten ver- 
deutlichen. 

Ad A) Halluzination von KI ist ein inhärentes Problem,'* das in Zukunft viel- 
leicht gelöst werden wird," aktuell aber für den gesellschaftlichen und wissen- 
schaftlichen Diskurs eine Gefahr darstellt. Das zentrale Problem der Halluzinatio- 
nen offenbart die eigentliche Zielsetzung von Textgeneratoren und stellt damit 
sogleich ihre Fragwürdigkeit im wissenschaftlichen Diskurs heraus. Textgenerato- 
ren haben vorwiegend den Zweck, einen möglichst menschenähnlichen Text oder 
Antworten auf eine Frage zu generieren. Sie haben (noch) nicht den Zweck, mög- 
lichst gute, richtige oder wahre Antworten zu geben. Da das GPT-Modell durch 
riesige menschen-generierte Datenmengen trainiert wurde, bilden diese Daten das 
semantisch-syntaktische Fundament der KI. Nur in diesem Rahmen agiert es und 
generiert Sprache, die dem Trainingsmaterial entspricht. Aber in den Daten, in der 
Syntax und in der Semantik als solche liegt keine Wahrheit. Der Satz: „Der Koffer ist 
aus grüner Seide“ mag zwar ein völlig korrekter Satz sein, wahr wird er aber für 
Menschen nur dann, wenn sie ihn durch Erfahrung, mithin durch Erleben - im 
Antreffen in der Lebenswelt — bestätigen können. Sprache hat nicht in sich die 
Fähigkeit, ontologische Gewissheit zu etablieren. Und eine durch Textgeneratoren 
generierte Sprache bezieht sich nicht einmal mehr auf die erfahrbare Lebenswelt, 
sondern gerade einmal auf die Syntaxfunktion der Sprache selbst; denn es werden 
Wörter der Wahrscheinlichkeit nach aneinandergereiht. Mit Heidegger könnte man 
sagen, dass die KI-Texte nur einen apophantischen Charakter haben, aber keinen 
hermeneutischen, weil in ihnen die lebensweltliche Situation nicht transportiert 
wird." Solche Texte machen alle Lesenden zu Jüngern zweiter Hand,” weil sie den 


14 Halluzinationen haben a) eine ideelle und eine b) technische Seite. Zuerst einmal (a) haben 
Textgeneratoren den Zweck, möglichst menschenähnliche, authentische Texte zu produzieren. 
Darin nicht enthalten sind Kriterien der Wahrheit, sondern nur der Wahrscheinlichkeit. Es gibt 
mithin im Programmkorpus keine Funktion zur Überprüfung der Richtigkeit der Texte. Dies ließe 
sich unter schwierigen Bedingungen wahrscheinlich ändern. Fener (b) sind Textgeneratoren so 
aufgebaut, dass sie zwischen dem GPT-Modell und der Ausgabe diverse Filter haben, die die Ant- 
worten des Textgenerators überprüfen, etwa darauf, oder die Antwort rassistisch ist oder überhaupt 
überzeugend. Diese Filter-Modell wurden durch Menschen trainiert. Sie funktionieren wie eine 
Reflexion auf den generierten Text und geben Bewertungen ab. Nur der Text mit der besten Be- 
wertung wird auf die UserInnen losgelassen. Da auch hier kein ‚Faktencheck‘ stattfindet, sondern 
möglichst authentische Texte den besten score erzielen, lügt der Textgenerator lieber, als nichts zu 
schreiben. 

15 Vgl. Roberto Simanowski, „Narrative der Weltbeglückung. Die neue Sprach-KI und die Mathe- 
matisierung der Ethik“, Blätter für deutsche und internationale Politik, Heft 6, 2023, 63-73, 67. 

16 Den Unterschied zwischen apophantisch und hermeneutisch kann man sich wie folgt klarma- 
chen: Heidegger meint z.B. in Heidegger 2006, 157 (833), dass der Satz „Der Hammer ist schwer“ in 
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Glauben an die Texte fordern und nicht an die hinter ihnen liegende Erfahrungen 
im Sinne verstehender Praxis. Damit scheint die Geltung der Texte von Textgene- 
ratoren ziemlich diskreditiert zu sein, weil sie streng genommen darin liegt, dass 
jemand irgendwann etwas so ähnlich geschrieben hat. Hinter dem Text der KI steht 
keine an der Erfahrung plausibel ausgewiesene Realität, sondern dahinter stehen 
sinnleere, obgleich syntaktisch korrekte Sprach-Daten.'® Halluzinationen sind so 
das genuine Produkt eine Sprach-Abstraktion ohne das Kriterium der Wahrheit. 
Ihre Einbettung in den wissenschaftlichen Diskurs verbietet sich aus Gründen der 
Redlichkeit. 

Ad B) Eine hermeneutisch reduzierte Überfülle klingt wie ein Paradox, aber 
gerade diese Paradoxie kann das Problem des hermeneutischen Zirkels verdeutli- 
chen, der durch die Textgeneratoren entstehen kann. Es ist nun unlängst darauf 
hingewiesen worden, dass die Textgeneratoren jenen Geist aus der Maschine lassen, 
mit dem sie trainiert wurden.'” Da die Textergebnisse eine Synthese dessen dar- 
stellen, was vorgegeben ist, spiegeln die Ergebnisse das Fundament. Das ist 


der Lebenswelt ‚zuerst‘ nicht vorkommt, insofern damit ein theoretischer Sinn über die physikali- 
sche Wirklichkeit eines Hammers ausgedrückt wird. Kein Mensch würde beim Arbeiten (also beim 
Hämmern) plötzlich feststellen, dass ein Hammer physikalisch die Eigenschaft der Schwere hat; 
solcher Sinn ist sekundär und apophantisch (nach Aristoteles können nur solche Sätze wahr sein). 
Hermeneutisch hingegen wird derselbe Satz, wenn er einen anderen (nämlich hermeneutischen) 
Sinn transportiert, also „Der Hammer ist schwer“ meint „Gib mir einen anderen Hammer!“ (Die 
Aussage ist eigentlich eine Aufforderung). Hermeneutische Sinnaussagen vermitteln also Situatio- 
nen wie Wünsche, Befehle usw. Selbst wenn KIs den hermeneutischen Sinn von menschlichen 
Texten entschlüsseln, kann man nur schwerlich annehmen, dass in der Synthese ihrer Texte ein 
hermeneutischer Sinn zur Geltung kommt — denn wer und in welchem Sitz des Lebens ist es, der 
schreibt? Vgl. zur Unterscheidung apophantisch und hermeneutisch. Otto Pöggeler, „Einführung“, in 
Hermeneutische Philosophie. Zehn Aufsätze, hg. von Otto Pöggeler, München 1972, 7-71, 21. 

17 Ähnlich hatte schon Kierkegaard jene christlichen Glaubenden kritisiert, die ihren Glauben 
allein auf die Beschreibung der Apostel gründen und nicht auf die primäre Glaubenserfahrung von 
Jesus Christus. Kierkegaard machte damit deutlich, dass zwischen Aposteln und heutigen Glau- 
benden im Hinblick auf die Wahrheit kein Unterschied besteht. Die Heutigen verhalten sich zur 
Beschreibung nur in Form einer Veranlassung; den Glauben erhalten sie dadurch nicht, sondern von 
Gott, wie die Apostel auch. Vgl. Sören Kierkegaard, Philosophische Brocken, hg. von Emanuel Hirsch, 
Düsseldorf 1952, 101-102. 

18 Man könnte hier einwenden, dass die wissenschaftliche Praxis doch ähnlich funktioniert. Schon 
Studierende müssen stupide Hausarbeiten schreiben, in denen Sie bloß wiederkäuen, was Y ge- 
schrieben hat. Diese Analogie ist durchaus berechtigt. Doch würde man einer solchen Hausarbeit, 
die nur rekapituliert, was andere schrieben, wohl ein Ungenügend bescheinigen, weil weder ein 
Textverständnis ausgewiesen, noch das Wiedergekäute plausibilisiert wurde. Das ist schlicht 
schlechte wissenschaftliche Praxis. 

19 Vgl. Rebecca Johnson et al., The Ghost in the Machine has an American accent. Value conflict in 
GPT-3, ArXiv, 2023, 1-11, in: [www.doi.org/10.48550/arXiv.2203.07785] (Zugriff: 26.09.2023). 
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grundsätzlich nicht anders bei Menschen, die das reproduzieren, womit sie etwa 
erzogen wurden.” Ein durchaus radikaler Unterschied liegt aber darin, dass 
Menschen qua kritisches Denken dazu in der Lage sind, ihre eigene „Veranlagung“ 
zu revidieren — und das geschieht oft in Situationen, die einen treffen, also wider- 
fahren und somit auf Sinn und nicht auf Informationen basieren. Das hermeneu- 
tische Problem liegt im gewissen Sinne in dieser fehlenden Reflexionsfähigkeit der 
KI: Die Synthese-Antwort ist mit dem Ziel formuliert, möglichst menschenähnlich 
zu klingen; damit geht aber auch einher, dass Informationen konzentriert und re- 
duziert werden.”' Denn die GPT-Modelle generieren Texte aus vor-trainierten Da- 
ten; sie schaffen damit noch keinen Sinn, wenn und insofern darunter eine kreative, 
denkende und existentielle Entfaltung eines Gegenstandes durch ein Subjekt ge- 
meint ist. Dass die Antworten ggf. rassistisch, kolonialistisch, usw. sein können, 
ließe sich durch Filter-Modelle ändern. Hier setzen sich in der Debatte um KI üb- 
rigens die grundlegenden gesellschaftlichen Fragen und kulturellen Kämpfe fort. 
Übersehen wird aber, dass, ganz gleich welche Antwort ein Textgenerator produ- 
ziert, diese nun „in der Welt“ ist - und somit selbst Teil neuer Trainingsdaten, bzw. 
Informationsbestandes wird. Ein hermeneutisches Zukunftsszenario ließe sich also 
wie folgt beschreiben: Je mehr Texte von KI produziert werden, desto mehr dieser 
Texte landen wieder im Netz und somit in der Datenbank der KI - aus denen heraus 
Textgeneratoren wieder Texte konstruieren, die wieder im Netz landen. Es handelt 
sich also um einen klassischen infiniten Regress, oder einen hermeneutisch-logi- 
schen circulus vitiosus, der zu einer Überfülle und Dominanz der Textgeneratoren- 
Texte führt. Weil diese Texte aber vorwiegend auf Reduktion aus sind, ist die 
Überfülle durch reduzierte Texte gekennzeichnet, also eine hermeneutisch redu- 
zierte Überfülle, die zwar immer unterschiedlich, aber dem Sinn nach das Gleiche 
schreiben würde. KI „verändert die Situation des Menschen durch die Automati- 
sierung kognitiver Prozesse mit der Nebenfolge der Standardisierung, sofern jeweils 
die gleichen Daten zugrunde liegen und keine Variation von außen [...] induziert 


20 Für den Kontext der Schule etwa hatte Bourdieu diesen reproduzierenden Charakter deutlich 
entfaltet. Vgl. Pierre Bourdieu, „Die konservative Schule“, in Wie die Kultur zum Bauern kommt. Über 
Bildung, Schule und Politik, Schriften zu Politik & Kultur 4 Hamburg 2001, 25-52. 

21 Wenn es richtig ist, dass die Textgeneratoren nur nach der gelernten Wahrscheinlichkeit Wörter 
aneinanderreihen, ohne sie aktuell durch eine Tatsachenüberprüfung zu korrigieren, dann liegt in 
der Wahl der größten Wahrscheinlichkeit bereits die logische Tendenz, das Unwahrscheinlichere 
und damit auch die ganze andere Fülle (die Negativität) auszulassen. Damit aber droht zugleich ein 
Herrschaftswissen und deren Machtinteressen das demokratische Feld zu okkupieren. Ein zweites 
Beispiel für ein Herrschaftswissen läge darin, dass die zum KI-Training genutzten Daten überhaupt 
nur von jenen erhoben werden können, die sich im Internet bewegen; alle ohne Internet, freiwillig, 
aber vor allem unfreiwillig, haben keine Stimme — dann auch nicht im Echo einer Chat-Kl. 
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wird.“”” Rein hypothetisch ließe sich sogar eine steigende Dominanz der KI gene- 
rierten Texte und Sprache gegenüber dem menschlichen Denken behaupten, sodass 
letztlich die KIs die Bedeutung der Worte qua Machtverhältnis überschreiben.” 

Wie aber ließen sich KI generierte Texte aus der Einspeisung in die KI her- 
aushalten? Das ist kein nur technisches Problem, sondern auch eine Frage nach der 
Demokratisierung und Pluralisierung von KI-Systemen.”* Man könnte nun einräu- 
men, dass das bei Menschen genauso ist, freinach dem Motto: „Schreibt Texte über 
Texte und lest Bücher über Bücher. Und zu allem Überfluss lest ihr Bücher über 
Bücher. Und schreibt Texte über Texte.“”° Doch hier übersieht man den Charakter 
der KI-generierten Texte; denn diese sind von niemanden geschrieben. Während 
sich Menschen also nur manchmal auf vorher unverstandene, aber geschriebene 
Menschen-Texte beziehen, beziehen sie sich bei KI-Texten immer auf Unverstan- 
denes (im Sinne Heideggers); denn es gibt schlicht niemanden, der zuhause (des 
Verstehens) wäre. Wie verändert das unser Verstehen und Denken? Darüber kann 
man aktuell nur spekulieren; was im Folgenden geschehen soll. 


5 Die Anonymität der KI - Niemand zuhause 


Viele bekannte KI-Tools zielen wohl gerade nicht darauf, einen Gegenstand in der 
ganzen Komplexität zu entfalten, sondern gegenläufig, die Komplexität auf Prä- 
gnanz zu reduzieren, sodass Zusammenfassung’? oder Positionen?” herauskom- 
men. Das sorgt dafür, dass der Kontext eines Sachverhaltes oder eines Gegenstandes 
schrumpft oder aber in einer Zuspitzung wahrgenommen wird, wie oben entfaltet. 
Zwar wird durch das wissenschaftliche Arbeiten die Interkontextualität weiterhin 
hergestellt, d.h. die Sachverhalte werden weiterhin untereinander verbunden und 
zum Netzwerk gebildet; dies aber nur in ihrer vorher selektierten Zuspitzung. Mit 
einem Bild gesprochen: die Zukunft (auch) der Wissenschaft ist der Artikel und 
nicht das Buch, ähnlich wie es in den Sozialen Medien der begrenzte Twitter- 
Kommentar ist und nicht ein Essay. 


22 Simanowski 2023, 72 (meine Kursivierung). 

23 So etwas ließe sich durchaus verhindern, indem man etwa bestimmte Texte oder Quellen zu 
unantastbaren Korrektivgrößen erhebt, gegen die eine KI nicht umdeutend agieren kann. Aber wer 
könnte und qua welche Autorität sollte jemand eine solche Normierung vornehmen? Das ließe sich 
in demokratischen Strukturen nicht legitimieren. 

24 Vgl. Simanowski 2023, 70-71. 

25 Aus einem Lied der ‚Antilopen Gang‘. 

26 Bspw. Scisummary, Quillbot. 

27 Bspw. DeppGPT. 
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Die digitale Logik bringt es mit sich, dass Verstehen und Wissen in einem 
Netzwerk, und das heißt in Relationen, situiert und konstruiert, weniger hingegen 
in seiner Bedeutungsfülle entfaltet werden. Technisches „Verstehen“ fußt auf der 
Korrelation von Daten. Uns Menschen erschließt sich aber durch bloße Korrelation 
(bspw. dass 50% aller Männer Schuhgröße 44 haben) kein Sinn;”* denn die Deutung 
und Bedeutung ist ein kreativer Prozess eines umweltlichen Verstehens: Verstanden 
ist eine Sache dann, wenn sie in der Dimension unsrer Lebenspraxis situiert wird, 
wenn sie also eine unmittelbare praktische Lebensrelevanz hat und das heißt, wenn 
sich ihre Bedeutsamkeit einem eindrücklich erschließt. Was aber geschieht mit 
Texten, die von niemanden geschrieben werden, die also ohne Lebenswelt situiert 
sind? 

Dann wird das präsentierte Material, also Informationsinhalte aus korrelie- 
renden Teilelementen zusammengebaut und vorgestellt, ohne dass die UserInnen 
durch eine kreative Aneignung in es hineinkommen und so daran wachsen. Wenn 
man etwa ein Buch liest und Teile davon unverständlich sind, was ja fast durchweg 
der Fall ist, ist das Potential gegeben, in einem Bildungsprozess kreativ das Un- 
verstandene ins Verstehen zu überführen; was gemeinhin im Denken geschieht. 
Dafür muss man an die Lebenswelt der VerfasserInnen herantreten und diese 
mitverstehen.”° Ist das Präsentierte aber von Vornherein so konzipiert, möglichst 
verständlich zu sein, weil die Sprache ahistorisch, nur formallogisch durch Korre- 
lationen konstruiert und das Unverstandene durch Kl ins Verständliche (bspw. nach 
mehrfacher Aufforderung) paraphrasiert wird, entfällt das Denken auf der Seite 
der NutzerInnen entweder oder es wird zu einer bloßen Informationsverarbeitung. 
Lukas Ohly hat dieses Problem präzise erfasst: 


Selbst beim Querlesen folgte der Rezipient noch der gehaltlichen Anordnung der Verfasserin. 
Bei der Suchwortanalyse [und der Sprachbildung durch KI] dagegen werden Bedeutungs- 
cluster auf ‚synchrone‘ Weise gebildet und auf die Korrelationen der Begriffe hin untersucht. 
Diese Vermittlung von Begriffen folgt der formalen Logik, die selbst digital ist [...]. Übersehen 
wird die geschichtliche Situierung der Begriffe bei der Autorin. Die Begriffe sind formale In- 
formationseinheiten und nicht ‚durchlebte‘ Gehalte [...].°° 


28 In diesem Zusammenhang spricht Kucklick richtig davon, dass Daten nie neutral sind. Um mit 
ihnen etwas anfangen zu können, müssen sie stets in einem Rahmen präsentiert werden und so 
verlieren Zahlen für Menschen sofort ihre Neutralität. Vgl. Christoph Kucklick, Die granulare Ge- 
sellschaft. Wie das Digitale unsere Wirklichkeit auflöst, Berlin 2015, 44. 

29 Das war die These der klassischen kritischen Exegese der Bibel: die Texte können nicht ver- 
standen werden, wenn wir die Lebenswelt der AutorInnen nicht kennen; der Kontext ist ebenso 
unabdingbar wie der Text. 

30 Lukas Ohly, „Noch etwas vergessen? Theologische Aufnahmen der Digitalität und ihre blinden 
Flecken“, in Theologie angesichts des Digitalen. Beiträge zu den theologischen Herausforderungen 
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Verkürzt könnte man also sagen: die Texte der KI sind Texte ohne Lebenswelt, weil 
sie bloße semantisch-syntaktische Korrelationen sind. Was KI produziert, hat nie 
jemand gedacht und schon gar nicht durchlebt, mithin nie verstanden. 

Nicht nur die Wissenschaft, sondern auch alle Gesellschaften sollten sich dann 
aber auch die Frage stellen, ob die Uberantwortung von genuin menschlichen 
Kompetenzen - Denken, Erleben, Texterstellen, Verstehen — bedenkenlos an KI 
delegiert werden sollten, wie der Ethikrat kürzlich hervorgehoben hat: 


Das spezifische Risiko von Kompetenzverlusten im Zusammenhang mit dem Einsatz von KI- 
Anwendungen liegt demnach in der Besonderheit der Tätigkeiten, die der Technik überlassen 
werden — handelt es sich dabei um gesellschaftlich besonders bedeutsame oder kritische 
Einsatzbereiche, ist ein Verlust von menschlichen Kompetenzen und Fertigkeiten ein ernst- 
zunehmendes Risiko.” 


Schließlich ist nahezu an jeder Technologie die dialektische Bewegung einer Er- 
weiterung und eines gleichzeitigen Verlustes (oben Begrenzung und Öffnung ge- 
nannt) ablesbar: Die Erfindung der Schrift erweitert das Wissen und das Spei- 
chervolumen - reduziert aber die Gedächtnisleistung des Menschen; das Navi 
verkürzt die Wege und die Orientierungszeit — reduziert aber zugleich das Orien- 
tierungsvermögen.”” Und das menschliche Schreiben von Texten? 


Im Schreiben kommt der Mensch zu sich. Delegiert er diese Erfahrung an die KI, verwandelt 
sich der Produktionsprozess [also auch der Selbsterkenntnisprozess] zurück in einen Rezep- 
tionsprozess: Man bleibt Leser, nämlich der Synthese an Informationen und Ansichten, über 
die nicht man selbst verfügt, sondern die KI. Insofern ist in der Tat ein Verlust kognitiver 
Fähigkeiten zu fürchten [...].°° 


Eine Gesellschaft muss sich die Situation vergegenwärtigen, was es heißt, dass der 
Mensch nicht mehr zu sich selbst kommt, weil er aufhört zu schreiben. Das 
Schreiben ist kein Selbstzweck; es ist Denken in Worte gefasst. Ein solches Denken 
transportiert unsere semantische Existenz, unsere Lebenswelt, letztlich unser 


durch Digitalität und Digitalisierung, hg. von Roman Winter-Tietel/Lukas Ohly, Frankfurt a.M. 2023, 
12-38, 35-36. 

31 Deutscher Ethikrat, Mensch und Maschine -— Herausforderungen durch Künstliche Intelligenz. 
Stellungname, 2023, 268. 

32 Vgl. Simanowski 2023, 67-68. 

33 Ebd. Ähnlich auch bei Hendrik Stammermann, „Lernen mit Textgeneratoren und Co.! Wie 
können wir die Kompetenzen unserer Schüler:innen mithilfe von künstlicher Intelligenz verbes- 
sern?“, Der Deutschunterricht, Heft 5, 2022, 88-94, 88: KI birgt „das Potential einer kognitiven ‚De- 
aktivierung‘, indem sie kognitive Operationen, z.B. das Überarbeiten, Paraphrasieren, [Interpre- 
tieren, Weiterführen, Kritisieren] sowie das Verfassen von Texten, anstelle der Lernenden 
durchführen.“ 
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Selbst. Wer aber nicht mehr zu sich selbst kommt, dem gehen nicht nur kognitiven 
Fähigkeiten verloren - er und sie hört auf, Selbst zu sein. 

Dass auch Kreatives mit der KI möglich ist, soll damit nicht abgesprochen 
werden. Kreativität kann im Zusammenspiel von Mensch und Maschine entstehen; 
sie ist ein menschliches Vermögen intrinsischer Motivation, Neues zu schaffen; die 
Kreativität kommt nicht aus der KI selbst - und schon gar nicht ‚von selbst‘. 

Was heißt das nun für die Textgeltung und den wissenschaftlichen Diskurs? 
Zuerst einmal muss die Sensibilisierung für die Risiken von Textgeneratoren und 
KI-Texten weiterhin im Diskurs bleiben, sodass ein kritisches Medienbewusstsein 
gerade bei den Kritischen wach erhalten wird. Das kann dazu führen, dass die 
Geltung der KI-Texte im wissenschaftlichen Rahmen reduziert, beziehungsweise 
ganz abgesprochen wird. Es kann aber auch dazu führen, dass die Kreativität im 
Umgang mit Textgeneratoren als Schlüssel zu deren Einhegung evoziert wird. Die 
Wissenschaft hat die besondere Verantwortung, nach der Wahrheit (der Texte) zu 
fragen und diese Wahrheitssuche durch Kreativität anzuregen, angesichts Künst- 
licher Intelligenzen, die nichts verstehen, sondern höchstens halluzinieren. 


Anne D. Peiter 
KI-Texte = Intertexte? 


Fragen der Geltung von Literatur im Mensch-Maschinen-Vergleich 


Abstract: The combinatorics of AI text generators in generating their texts is already 
commonplace in literary studies: Intertextuality and learning from previous texts, 
incorporating them, using them or even resisting them are all things we know from 
literary history and which also function in AI. And yet the human and the machine 
generation of texts have to be distinguished in terms of the literary criteria of un- 
predictability and freedom. It is not only in writing that the unpredictable is sought; 
the openness to surprise of interpretation attempts in reception also contributes to 
the unpredictability of literary texts. Although some human text genres are easily 
simulated (nuclear war fantasies are considered as an example), others contain 
inauthentic speech that is not transferable (comedy is mentioned, where what is 
said appears in contrast to what is meant). The article tries to define the „unlear- 
nable“, surprising moments of a literature that can only be written by humans. 


1 Zur Einführung 


Die intertextuelle Vernetzung von Texten, die den Ruf des „Todes des Autors“ be- 
fördert! und der Frage nach dem individuellen Schreibenden Kontur verliehen hat, 
kann als ein „Lernen vom anderen“ betrachtet werden. Nicht nur der:die Autor:in 
im Singular schreibt, sondern die Textbezüge, die - mehr oder weniger bewusst, 
mehr oder weniger elaboriert - zu etwas Eigenem gemacht und so als für den 
Schreibenden selbst für gültig erklärt werden, „schreiben mit“, und zwar im Plural. 
Intertextualität entspricht nicht einer Aufhebung der Literarizität von Texten. 
Vielmehr ist sie ein ebenso gängiges wie zumindest potenziell produktives Proze- 
dere, um sich als Autor:in in einen literarischen Traditionszusammenhang zu 
stellen oder im Gegenteil sich von diesem abzugrenzen.” Ideen fürs Schreiben 
kommen also nicht allein aus dem, was man als „Wirklichkeit“ oder „Gelebtes“ 


1 Roland Barthes, „Der Tod des Autors“, in Texte zur Theorie der Autorschaft, hg. von Fotis Jannidis 
et al., Stuttgart 2000, 185-193. 

2 Zu der Abgrenzung gehört das Phänomen, unter Einfluss von Vorgänger:innen zu geraten. 
Theoretisiert worden ist dies von: Harold Bloom, The Anxiety of Influence: A Theory of Poetry, New 
York 1973. 


8 Open Access. © 2024 bei den Autorinnen und Autoren, publiziert von De Gruyter. Dieses Werk ist 


lizenziert unter einer Creative Commons Namensnennung - Nicht kommerziell - Keine Bearbeitung 4.0 International 
Lizenz. https:/doi.org/10.1515/9783111351490-017 
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bezeichnen könnte. Vielmehr resultieren sie auch aus Gelesenem, Angeeigneten, 
sobald dieses als geeignet fürs Eigene anerkannt wird. 

Kurz: Wenn die KI beginnt, sich für die Herstellung von Texten im weiten, li- 
terarischen Erbe umzusehen, ist das an sich nichts Ehrenrühriges, ja nicht einmal 
spezifisch Maschinenhaftes oder per se Angstauslösendes. Lernen - intertextuell 
lernen - tut der Mensch ja auch, und er tut es seit jeher, selbst wenn die Litera- 
turwissenschaft die systematische Erforschung von Intertextualität erst in den 
1980er und 1990er Jahren zu ihrem Steckenpferd erklärt und so den Begriff von Text 
und seinen Rändern neu definiert hat, nämlich hin zu so etwas wie ausgefaserten 
Seiten, die allüberall in andere, fremde, jetzt ins eigene Schreiben hineingeholte 
Texte übergingen.? 

Die Diskursanalyse könnte als eine Fortsetzung dieses Interesses für Literatur 
als Großkorpus voller Übergänge zwischen Texten verstanden werden. Sie unter- 
sucht Wiederholungen, Verschiebungen und die Entstehung neuer Bedeutungen in 
der kollektiven Auseinandersetzung mit bestimmten Themen, gesellschaftlichen 
Problemen oder Konzepten.* Dies läuft auf eine weitere Schwächung des Gewichts 
hinaus, die dem:der Einzelnen bei der Textgenese zugewiesen werden kann. Ein 
„Es“ spricht, schreibt oder murmelt unter- oder überschwellig, und diese Tatsache 
kann sich den Textproduzent:innen mitunter komplett entziehen. 

Wenn in der Forschung Diskursanalyse betrieben wird, heißt das stets, dass 
eine große Menge von Texten in den Blick gerät, um an deren Beispiel Wiederho- 
lungsstrukturen ebenso zu untersuchen wie die oft langsamen Veränderungen, die 
sich — mal individuell bedingt, mal hervorgerufen durch neue, historische Kontexte 
oder Ereignisse, institutionelle Gegebenheiten oder Machtverhältnisse — im Spre- 
chen über bestimmte Dinge ergeben. 

Wenn nun die KI darauf beruht, anhand eines quantitativ das menschliche 
Auffassungsvermögen übersteigenden Korpus das „literarische Schreiben zu ler- 
nen“, dann ergibt sich die Frage, ob durch die Kombinatorik aus Bausteinen des 
Gelernten nicht etwas zustande kommt, was zu der Intertextualität von Literatur 
Ähnlichkeiten aufweist? Müsste die einst blühende Forschung zur Intertextualität 
die Literaturwissenschaft nicht vorbereitet haben für Geltungsfragen, die heute die 


3 Dass man „ausgefranste Ränder“ von Texten am besten in den Blick bekommt, wenn man sie mit 
so etwas wie einer „Gleitsichtbrille“ betrachtet, wird ausgeführt in: Anne D. Peiter, „Lesen mit der 
Gleitsichtbrille. Zueignungen und widmende Gaben in Büchern der Privatbibliothek von Christa 
und Gerhard Wolf“. Der Artikel erscheint voraussichtlich 2024 in einem Sonderdruck der Arbeits- 
und Forschungsstelle Christa und Gerhard Wolf, hg. von Birgit Dahlke. Gemeint ist mit dem Konzept 
der „Gleitsichtbrille“, dass der lesende Blick in einer permanenten Bewegung zwischen dem nahen 
Detail und dem Übergang zu „Entferntem“, „Makroskopischem“ begriffen ist. 

4 Weiterhin unverzichtbar: Michel Foucault, Die Ordnung des Diskurses, Frankfurt a.M. 2001. 
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KI stellt? Und läuft nicht auch die Untersuchung von Text-Genres auf eine mögliche 
Auseinandersetzung mit den Prozessen hinaus, die ablaufen, wenn das Schreiben 
der „Maschine“ bestimmte, relativ bestimmbare Gattungsmerkmale zu „bedienen“ 
versucht? 

Es sind diese Fragen, die ich im Folgenden anhand ausgewählter Beispiele ge- 
nauer unter die Lupe nehmen möchte. Drei Themenblöcke sollen in den Blick rü- 
cken. Ein erster Abschnitt befasst sich mit der Marktförmigkeit von Science-Fiction- 
Texten und den Aspekten ihrer Imitierbarkeit.’ Ich entwickele hier die These, dass 
es Mainstream-Texte gibt, deren Strukturen leicht identifizier- und damit imitierbar 
sind. Atomkriegsphantasien werden mir als pars pro toto fiir andere Arten von Plots 
dienen.® Auch bestimmte Arten von Krimis, Abenteuer- oder Liebesromanen sind 
beschreibbar als mehr oder weniger vorhersehbare Erzahlablaufe, das heißt als 
sprachliche Schemata. 

In einem zweiten Schritt soll es mir um den Zusammenhang von Komik und 
Intertextualitat und die schwere Erlern-, ja Erkennbarkeit des ironischen Sprechens 
gehen.’ Auch hier kann ich nur exemplarisch einige Fragen skizzieren, die aber 
samtlich auf ein Gegengewicht zu den Beobachtungen rund um die Atomkriegs- 
phantasien hinauslaufen. Ein uneigentliches Sprechen ist ebenso schwierig zu 
verstehen wie nachzuahmen, lautet die These dieses Abschnitts. 

Abschließend werde ich das Konzept des „autobiographischen Paktes“ disku- 
tieren, das heißt der Frage nachgehen, wie die „Wirklichkeit“ ausgehebelt zu wer- 
den droht, wenn autobiographische Muster von maschinellem Schreiben aufge- 
griffen werden, ohne dass es dahinter noch einen Autor oder eine Autorin gibt. Ich 
werde mit konkreten Beispielen aus ganz unterschiedlichen Bereichen des litera- 
rischen Marktes operieren, um auf diese Weise Ähnlichkeiten und Unterschiede 
zwischen Texten, die sich der menschlichen, und Texten, die sich der künstlichen 
Intelligenz verdanken, herauszuarbeiten. Es wird hier um das Problem einer 


5 Zu Wiederholungsstrukturen bei diesem Genre der Science-Fiction vgl. z.B.: Anne D. Peiter, 
„Atomkrieg als planetarischer Mord. Zu einem literarischen Topos in science-fiktionalen Texten 
westdeutscher, französischer und amerikanischer AutorInnen“, in Mord / Murder, hg. von Franz- 
Josef Deiters et al., Nomos 2021, 149-166. — Anne D. Peiter, „Atomgestank‘. Zur Pazifik-Literatur der 
1940er und 1950er Jahre“, in Pazifikismus. Poetiken des Stillen Ozeans, hg. von Johannes Görbert et 
al., Würzburg 2017, 373-390. 

6 Guy Oakes, The imaginary war. Civil defense and american Cold War culture, New York 1994. 
7 Zu meinen Vorarbeiten gehören die folgenden Publikationen: Anne D. Peiter, Komik und Gewalt. 
Zur literarischen Verarbeitung der beiden Weltkriege und der Shoah, Köln 2007. 

8 Philippe Lejeune, Le Pacte autobiographique, Paris 1975. 
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„Entwirklichung“ gehen, die mit den sich ausbreitenden Verschwörungsmythen 
unterschiedlicher Provenienz zusammenhängt.” 

Insgesamt besteht mein Ziel darin, zu bestimmen, worin die „nicht-erlernba- 
ren“, überraschenden Momente einer Literatur bestehen, die allein von Menschen 
verfasst werden können. Meine These besagt, dass der Ausbruch aus kulturellen 
Paradigmen das — zumindest vorläufig - Unnachahmbare ausmacht, dass also die 
Wiederholungsstrukturen von Literatur zu bedenken sind, wenn man erkennen 
will, wo Mensch und „Maschine“ sich voneinander abheben. Mit anderen Worten: 
Die Überraschung hat ins Zentrum zu treten, das Unvorhersagbare, oder auch, um 
Ruth Klüger zu zitieren: die Freiheit, um das Menschliche nicht nur als Allzu-, 
sondern auch als Allein-Menschliches zu bestimmen. 

Ruth Klüger definiert den Begriff der „Freiheit“ in ihrer Autobiographie, die der 
Verfolgung im Nationalsozialismus gewidmet ist, auf ebenso originelle wie lako- 
nische Weise. Es wird dort die Idee vertreten, es könne „die äusserste Annäherung 
an die Freiheit nur in der ödestens Gefangenschaft [...] stattfinden, also dort, wo die 
Entscheidungsmöglichkeiten auf fast Null reduziert sind. In dem winzigen Spiel- 
raum, der dann noch bleibt, dort, kurz vor Null, ist die Freiheit.“'° Nun ging es, als 
Klüger diese These aufstellte, natürlich um etwas völlig anderes, etwas absolut 
Dramatisches, nämlich um die Hilfe, die ihr von Seiten einer jungen Mitgefangenen 
in Auschwitz zuteil wurde, um in einen rettenden Transport, weg von der Ver- 
nichtung, aufgenommen zu werden. Doch interessant an einer Sicht aufFreiheit, die 
sich von ihrem extremen Gegenteil her definiert, ist, dass die Entscheidungen, die 
ein Mensch trifft, bis zu einem gewissen Grade nicht vorhersagbar sind. Und das 
heißt: Die Freiheit kann plötzlich in Anspruch genommen werden, sie kann auch 
dann noch versucht werden, wenn schon alle Tore geschlossen zu sein scheinen und 
kein Spielraum mehr zu erkennen ist. 

In eine quasi unüberspringbare Voraussagbarkeit des Verhaltens (oder eben 
auch: des Schreibens) kann sich eine Selbstbehauptung mischen, und diese Selbst- 
behauptung vermag, wie dies bei Klüger der Fall gewesen ist, den Anderen, den Mit- 


9 Probleme, die sich mit jüngsten Verschwörungsmyten verbinden, werden u.a. diskutiert in: 
Wolfram Ette/Anne D. Peiter, Der Ausnahmezustand ist der Normalzustand, nur wahrer. Texte zu 
Corona, Marburg 2021. - Gleichfalls einschlägig: Anne D. Peiter, „Hitler-Merkel, Pétain-Macron, die 
Resistance und der Genozid an Ungeimpften. Überlegungen zu Erinnerungsräumen und -kon- 
strukten deutscher und französischer ‚Corona-Gegner‘“. Dieser Artikel erscheint voraussichtlich 
2024 in einem Sammelband zu deutsch-französischen Erinnerungsräumen. - Zur Rolle der sozialen 
Medien und des Internet vgl.: Anne D. Peiter, „Impfen macht frei.‘ Überlegungen zu Erinnerungs- 
räumen und -konstrukten in Memes westeuropäischer ‚Corona-Leugner‘“. Auch dieser Artikel wird 
2024 erscheinen. 

10 Ruth Klüger, weiter leben. Eine Jugend, Göttingen 1994, 136. 
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und Nebenmenschen in einer plötzlichen Wendung ins Zentrum stellen. Das ist das, 
was erstaunt, weil es nicht antizipierbar, ja vielleicht noch nicht einmal lehrbar, 
nicht zu erlernen ist. Es wird am Ende meines Beitrags zu fragen sein, ob sich etwas 
von diesem emphatischen Begriff der Abgrenzung der menschlichen Intelligenz 
und ihrem emotionalen Unterbau wird retten lassen. 


2 Wiederholungsstrukturen auf dem Markt der 
Atomkriegsphantasien 


Es entspricht das eben Skizzierte einer hehren Idee vom Menschen, die, wenn man 
sich den Mainstream des Buchmarkts ansieht, so nicht die Regel ist. Vielmehr hätte 
man wohl erst einmal zu betonen, dass die KI angesichts der Marktförmigkeit vieler 
Produkte, die sich literarisch nennen, so sinnlos nicht ist. (Und dies ist, wohlge- 
merkt, die Position einer Literaturwissenschaftlerin, einer Person, die sich mit 
Literatur beschäftigt, weil sie dieser im besten Fall eine andere, erstaunliche, be- 
reichernde Sicht auf Welt zutraut.) Doch die ausführliche Beschäftigung mit sci- 
ence-fiktionalen Atomkriegsphantasien lässt mich daneben die Prognose treffen, 
dass bestimmte Erzählplots von einer KI, die sich, vom Menschen gefüttert, ans 
Lernen macht, leichtens werden imitiert lassen. Statt gleich auf die Freiheiten des 
Schreibens loszugehen, möchte ich also erst einmal die unterschwellig melancho- 
lische These ausloten, die besagt, dass die Identifizierung von Mustern bei diesen 
wieder so unerwünscht aktuell gewordenen Geschichten über die mögliche Ver- 
wendung der „Superwaffe“ nicht besonders schwerfallen wird. 

Ich möchte kurz resümieren, was ich bei der Untersuchung eines groß ange- 
legten Korpus von Atomkriegsphantasien beobachtet habe. Fast durchgängig wird 
die Leserschaft zu Beginn dieser Texte vor ein häusliches Setting gestellt, in der eine 
Familie mit klar identifizierbaren Protagonist:innen ihrem Alltag nachgeht.'' In 
diesen Alltag hinein explodiert dann im Wortsinn wie ein Blitz die Bombe.” All das, 
was auf diesen folgt, ist nichts weiter als die Auseinandersetzung mit den Konse- 
quenzen der durch die Explosion hervorgerufenen Zerstörungen und Gefahren. Die 
Radioaktivität, die mehr ist als nur ein „Nebenprodukt“ der Produktion von Tod, 
nämlich ein Weiterwirken der Waffe in mitunter unübersehbar lange Zeiträume, 


11 Vgl. dazu: Anne D. Peiter, „Atomkrieg und Literatur oder: Die Unverdaulichkeit der Zukunft. 
Überlegungen zur ,Futurologie des Essens‘ in science-fiktionalen und wissenschaftlichen Texten“, in 
Zurück in die Zukunft. Die Bedeutung von Diskursen über die „Zukunft“ in der Wissenschaftsge- 
schichte, hg. von Klaus Freitag/Dominik Gross, Kassel 2017, 125-136. 

12 Dazu auch: Oakes 1994, passim. 
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pflegt in literarischen Atomkriegsphantasien am Rande erwähnt zu werden, doch 
erstaunlicherweise ohne die gar zu genaue Ausmalung der konkreten Folgen, die 
der Fall-out auf menschliche wie tierische und pflanzliche Organismen hat.” Es ist 
beim Lesen festzustellen, dass Haarausfall, innere Blutungen, schwere Durchfalle, 
Erbrechen, Verbrennungen, geschädigte Föten oder - um nur das bekannteste 
Beispiel zu nennen — Krebserkrankungen aus der Antizipation von Zukunft säu- 
berlich herausgehalten werden,'* was wiederum die Frage in den Raum stellt, in- 
wieweit dieser Art von Literatur überhaupt die Fähigkeit zugetraut werden kann, 
etwas über Zukunft auszusagen.’° Science-fiction ohne Zukunft’? scheint eine ganz 
regelwidrige Textgattung zu sein, doch meine Untersuchungen haben gezeigt, dass 
dies in der Tat ein weit verbreitetes Phänomen darstellt. 

Des Weiteren ist es dann so, dass die Nebenfiguren, und zwar mitunter anonym 
und in Massen, in diesen Texten zugrunde zu gehen pflegen.’ Doch zentral ist, dass 
die Figuren, die der Leserschaft zwecks Identifikation dargeboten werden, in der 
Regel, wenn auch, zugegeben, erst nach Überwindung einiger Schwierigkeiten, 
siegreich aus dem allgemeinen Chaos hervorgehen, um die Menschheitsgeschichte 
mutig ein zweites Mal beginnen zu lassen.'* Häufig, ja geradezu topisch sind tro- 


13 Genaueres dazu in: Anne D. Peiter, „Radioaktivität. Wahrnehmbarkeitsgrenzen und das Un- 
aussprechliche. Überlegungen zu epistemologischen Darstellungsproblemen in deutschen und US- 
amerikanischen Science-Fiction-Texten“, in Manifestationen des Unaussprechlichen. (Un)mögliche 
Welt- und Selbsterkenntnis in Literatur und Kunst, hg. von Agnieszka K. Haas, Danzig 2018, 144-156. 
14 Das genaue Gegenteil gilt für die Schriften des Philosophen Günther Anders, der versucht hat, 
das „prometheische Gefälle“ zwischen Mach- und Vorstellbar ins Zentrum zu rücken, um auf diese 
Weise eine produktive Angst vor einem möglichen, atomaren Schlagabtausch hervorzubringen. 
Günther Anders, Der Mann auf der Brücke. Tagebuch aus Hiroshima und Nagasaki, München 1963. — 
Gleich im „Nachfeld“ der Bombardierungen von Hiroshima und Nagasaki wurde von Naturwis- 
senschaftler:innen und Mediziner:innen die Folgen der Radioaktivität im Detail dokumentiert — 
natürlich mit Blick auf eine „Effizienzsteigerung“ bei möglichen weiteren Kriegen, in denen diese 
„superwaffe“ zum Einsatz kommen würde. Vgl. Los Alamos Scientific Laboratory, The effects of 
atomic weapons, New York et al. 1950. 

15 Anne D. Peiter, „Oberirdische Leere, unterirdische Enge. Architektonische Zerstörungs- und 
Bunkerphantasien in science-fiktionalen Texten des Kalten Kriegs“, in kritische berichte. Zeitschrift 
für Kunst- und Kulturwissenschaften, Bd 46(3), 2018, 92-98. 

16 Zu Zukunftskonzepten vgl. Lucian Hölscher, Die Entdeckung der Zukunft, Göttingen 2016. 

17 In der Regel handelt es sich um gewissermaßen „grundlose“ Kriege. Diese bemerkenswerte 
Beobachtung wird diskutiert in: Bruce G. Blair: The logic of accidental nuclear war, Washington D.C. 
1993. 

18 Ein paradigmatisches Beispiel dafür ist: René Barjavel, Ravage, Paris 2007 - Zur Interpretation 
dieses Textes und seiner Kon- und Intertexte: Anne D. Peiter, „Zwischen Angst und Verdrängung. 
Atombomben- und Bunkerphantasien am Beispiel von science-fiktionalen Texten von René Barjavel, 
Günter Eich und Mordechai Roshwald“, in Emotions, politique et médias aux XX° et XXT siècles / 
Emotionen, Politik und Medien im 20. und 21. Jahrhundert. Perspectives franco-allemandes pour une 
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glodytenartige Lebensweisen, in denen die Geschichte technischer Erfindungen von 
Neuem begonnen und zivilisatorische Standards neu diskutiert werden, und zwar 
stets erfolgreich und auf ein antizipierbares Happy-End gerichtet.'? 

Zusammenfassend lässt sich sagen, dass an Optimismus kein Mangel ist und 
Atomkriege nicht mehr sind als eine günstige Gelegenheit, spannende Abenteuer- 
geschichten mit viel Schau- und Schauderlust zu entwickeln, begleitet stets von der 
sich erfüllenden Erwartung, es werde letztlich alles wieder gut werden.” 

Ich habe diese Mainstream-Literatur darum so ausführlich skizziert, weil sie 
die obige These von der Imitierbarkeit stützt. Um zu verstehen, wie wirkungs- 
mächtig sie auf dem literarischen Markt sind, ist es nötig, sich die kritischen Ge- 
gentexte vor Augen zu halten. Verkaufbar ist, so lautet das Ergebnis der einschlä- 
gigen Studien, was nicht gar zu schrecklich endet. Die wenigen Texte, die sich durch 
ihren Pessimismus und ihr katastrophisches Ende von den Genre- und Verkauf- 
barkeits-Vorgaben abgrenzen, das heißt nicht den ökonomischen Erfolg ins Zen- 
trum stellen, erinnern die Leserschaft daran, dass es Orte wie Hiroshima und Na- 
gasaki gegeben hat, an denen sehr wohl und sehr genau zu lernen war, was 
Atombomben anrichten.” Doch diese pessimistisch-düsteren Plots sind nichts 
weiter als die Ausnahme, die die Regel bestätigt. Aber sie - also die Ausnahme - 
zeigt eben ex negativo, dass Autor:innen und Verleger:innen mit Blick auf die Le- 
segewohnheiten des Publikums normalerweise im Gleichschritt zu gehen pflegen.”” 
Die kritischen Texte also verleihen den Praktiken des Mainstreams Kontur - 
schlicht weil sie anders funktionieren und auf diese Weise die Momente der Wie- 
derholung und Standardisierung noch besser erkennen lassen. Und das heißt wie- 
derum, dass schon jetzt, und zwar unabhängig von den zu erwartenden Text-Aus- 


histoire européenne des émotions / Ein deutsch-französischer Blick auf eine europäische Emotions- 
geschichte, hg. von Valerie Dubslaff et al., Brüssel/Berlin 2021, 131-148. 

19 Der gleichen Erzählstruktur folgen auch die Bunkerbau-Filme, die als „Lehrfilme“ verbreitet 
wurde. Eine Liste dieser Filme findet sich in: Anne D. Peiter, Träume der Gewalt. Studien der Un- 
verhältnismässigkeit zu Texten, Filmen und Fotografien. Nationalsozialismus — Kolonialismus — 
Kalter Krieg, Bielefeld 2019. Hier nur ein Beispiel: Lehrfilm New family in town, 1956 (Dauer 12:22); 
Robert J. Enders Production, Erzähler: Robert Preston, Regisseur: Robert L. Friend; in Zusammen- 
arbeit mit der Federal civil defense administration; abgerufen am 14.06.2017 

20 Bunkerbauprojekte spielten bei diesem Optimismus eine entscheidende Rolle. Zur Schwierig- 
keit, private Haushalte zur Finanzierung dieser Schutzräume zu veranlassen, vgl.: Kenneth Rose, 
One nation underground. The fallout shelter in american Culture, New York 2002. - Wie Bunker in 
Science-Fiction-Texten ausgemalt werden, wird beschrieben in: Anne D. Peiter, „Genormtes Leben 
unter der Erde. Bunkerphantasien und Baukonzepte in der Science-Fiction-Literatur des Kalten 
Krieges“, in Wohnen jenseits der Normen, hg. von Manfred Seifert/Thomas Schindler, 2022, 165-182. 
21 Ich denke z.B. an einen 1947 erschienenen Roman von: Ward Moore, Greener than you think, 
Charleston 2008. 

22 Paul Brians, Nuclear holocausts. Atomic war in fiction 1895-1984, Kent (Ohio)/London 1987. 
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stößen der KI, der Konformismus die nicht besonders literarische, doch konsu- 
merisch gesprochen einträgliche Regel ist. 

Das ist literatursoziologisch wie politisch bemerkenswert, stimmt aber hin- 
sichtlich der Frage, worin das Eigene von Literatur bei der Auseinandersetzung mit 
einer planetarischen Gefahr bestehe, die heute aktueller ist denn je, nicht eben 
optimistisch. Zugespitzt gesprochen: Ob Mainstream-Texte noch in Zukunft von 
hoffnungsschwangeren Menschen dem Papier aufgedrückt werden oder gleich im 
Hirn nicht-menschlicher Intelligenzen entstehen, ist eigentlich ziemlich sekundär, 
denn um die Frage nach der Verbindung von Literatur und kriegerischer Wirk- 
lichkeit geht es sowieso nicht. 

Das ist jetzt aber nur ein Aspekt des Zusammenhangs zwischen Intertexualität 
und Erlernbarkeit, denn selbstverständlich gibt es auch andere, anspruchsvollere 
Texte. So stellt zum Beispiel Günter Eich in seinem Hörspielklassiker „Träume“, in 
dem unter anderem ein Atomkriegstraum geträumt bzw. zum Alp gemacht wird,” 
die Leserschaft vor ein definitorisches Problem: Es sei in Deutschland ein Kind mit 
zwei Köpfen geboren worden, der Standesbeamte habe aber lediglich die Frage zu 
beantworten gehabt, ob es sich bei diesem Kind um eine oder hingegen um zwei 
Geburten gehandelt habe. Die Anspielung auf die gesteigerte Gefahr der Schädigung 
von Erbgut und behinderten Kindern durch die radioaktive Strahlung ist hier un- 
verkennbar. 

Interessant ist dieser Textbaustein, weil er mit ironischer Lakonie verfährt und 
mit einer Geste, die man geradezu als wegwerfend uninteressiert zu bezeichnen 
hat, auf ein Problem aufmerksam macht, das im Zentrum der Angst vor einem 
„Dritten Weltkrieg“ zu stehen hätte: das Problem der langfristigen Folgen dieser Art 
von Krieg. Die ebenso unterschwellige wie grausige Komik, die sich bei Eich ab- 
zeichnet, führt hin zu einem Ende der Geschichte, wie es katastrophischer und 
radikaler kaum sein könnte: Die Protagonist:innen sterben sämtlich, und mit ihnen 
die gesamte Stadt New York, ja die Welt überhaupt. 

Wir haben hier also einmal ein Gegenexempel vor uns, das aber, wenn die KI 
lernt, nicht das vorherrschende Muster darstellt. Vielleicht ist es jedoch gar nicht so 
schwierig, die KI zu bitten, das Genre zu bedienen, dann aber ein Ende zu erfinden, 
das der Leserschaft als „dickes Ende“ jede Form von billigem Zukunfts- und Tech- 
nikvertrauen ausbläst. 


23 Günter Eich, „Träume“, in ders., Gesammelte Werke, Bd. 2, Frankfurt a.M. 1991. - Dazu: Anne D. 
Peiter, „Der akustische Tod. Zu medizinischen Fantasien in Günter Eichs Hörspiel Träume“, Re:visit, 
2022, in [https://doi.org/10.57974/Re:visit_2022_1.13] (Zugriff: 23.08. 2023). 
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Ich vermute, dass dem so ist, doch was das Lernen, das ich jetzt einmal als 
„intertextuelles Lernen“ fassen möchte, schwierig macht, ist der Aspekt der Komik, 
der sich, wie eben gezeigt, in Eichs Hörspiel mischt.”* 

Und damit komme ich zu meinem zweiten Abschnitt, nämlich zum Sonderfall 
des uneigentlichen Sprechens mittels eines Zitats. Bisher hatten wir festgestellt, 
dass sich bestimmte Geschichten von einem Autor zum anderen, von einer Autorin 
zur anderen schablonenartig wiederholen lassen und auch für die KI kein schwerer 
Lernstoff sind. Doch jetzt möchte ich die gegenteilige Hypothese prüfen, und zwar 
am Beispiel der Komik. 


3 Unsterbliche Komik 


Die Erfahrung im Bereich der Literaturdidaktik mit Nicht-Muttersprachlern legt die 
These nah, dass das, was im Deutsch-als-Fremdsprache-Unterricht schwierig ist, 
auch bei den KI-Produktionen schwierig sein wird. Mensch und „Maschine“ stehen 
hier vor den gleichen Problemen. Ironie ist uneigentliches Sprechen. Gesagt wird 
das Gegenteil vom Gemeinten. Ausländische Studierende können notwendiger- 
weise weder alle kulturellen und sprachlichen Codes kennen noch mit sämtlichen 
historischen Kontexten vertraut sein, vor denen sich ironisches oder komisches 
Schreiben entwickelt. 

Dies führt wiederum dazu, dass Leseprogramme für die Studierenden oft un- 
gewollt ernsthaft sind, komische Texte bedauernd hinausgeworfen werden, doch 
nicht etwa, weil kollektive und geteilte Lach-Attacken nicht interessieren würden, 
sondern schlicht, weil Komik und Ironie Schwerst-Arbeit sind und nicht ein lustiges 
Zuckerlecken. 

Das satirische Werk von Karl Kraus wird, so ist zu prognostizieren, Geltung und 
Gültigkeit behalten und sich der Imitierbarkeit durch die KI entziehen.” Die In- 


24 Zur theoretischen Beschreibung von Komik weiterhin unverzichtbar: Wolfgang Iser: „Das Ko- 
mische: ein Kipp-Phänomen‘“, in Das Komische, hg. von Wolfgang Preisendanz/Rainer Warning, 
München 1976, 398-402. — Theoretisch einschlägig: Anne D. Peiter, „‚Man lacht, anstatt es zu essen‘. 
Canettis Lachtheorie und ihre Bedeutung für die Methodik von ‚Masse und Macht“, Austriaca- 
Zeitschrift, Bd. 61, 2005, 115-124. 

25 Als Hauptwerk eines intertextuellen Zitate-Feuerwerks darf weiterhin gelten: Karl Kraus, Die 
letzten Tage der Menschheit, Frankfurt a.M. 1986. — Zur intertextuellen Verbindung zwischen Psy- 
choanalyse und Kraus’ Werk vgl.: Anne D. Peiter, „Freuds Konzepte von ‚Versprecher‘, ‚Trauma‘ und 
‚Verdrängung‘ als Ausgangspunkte literarischer Verfahren in den ‚Letzten Tagen der Menschheit‘ 
von Karl Kraus“, Recherches Germaniques, Bd. 23, 2002, 47-68. 
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tertextualität sieht sich hier derart ins Extrem getrieben, dass eine Trennung von 
Zitat und Zitierendem, aus anderen Texten Übernommes und Aneignung durch den 
Autor kaum noch möglich ist.” Karl Kraus darf also als Paradigma gelten, um zu 
behaupten, dass hier eine Grenze wirksam werden wird zwischen KI und MI, der 
„menschlichen Intelligenz“. 

Walter Benjamin war der Auffassung, der Satiriker sei eine kannibalische Figur, 
und das ist bei Karl Kraus in der Tat mustergültig nachzuvollziehen: Er macht sich 
die Gegner, die er angreift, fast leiblich zueigen, er verspeist sie, er labt sich und 
seinen Hass an ihnen. Entfiele das Material, das da in extenso zitiert und zugleich zu 
etwas Eigenem gemacht wird, so gäbe es keine Literatur mehr. Kraus erfindet nicht, 
sondern er findet. Er lebt schreibend ganz von der äußeren Textwelt, die er sich 
anverwandelt, um einsam und allein gegen sie zu stehen. Das ist Intertextualität als 
große Kunst, und diese ist schwer imitierbar. 

Hinzu kommt, dass sich im Laufe seines Werkes eine zunehmende Komplexität 
ergibt, in der dem Zitieren von vorgefundenem Journalistischem Zitate aus der 
Literatur sowie Eigen-Zitate aus vorherigen, selbst geschriebenen Texten an die 
Seite treten. Eigenes und Fremdes gehen eine unauflösliche Einheit ein, und ver- 
standen werden können die kraus‘schen Texte am Ende praktisch nur, wenn man 
zumindest in Ansätzen mit dem Gesamtwerk vertraut ist. 

Jetzt könnte man einwenden, die KI sei ja gerade dadurch ausgezeichnet, dass 
sie quantitativ weit mehr Text-Korpora zu „erlernen“ und weiterzuentwickeln 
vermöge, als dies dem Menschen möglich ist. Die Kl ist als Leserin schlicht fleißiger, 
als eine bemühte Leserschaft es je sein könnte. 

Doch an dieser Stelle kommen zwei weitere Aspekte mit ins Spiel, die die Un- 
terscheidung zwischen Mensch und „Maschine“ bestehen lassen werden. Da ist 
erstens die positiv zu verstehende Einseitigkeit, der ein Karl Kraus bei seinen in- 
tertextuellen Gängen durch die Welt gefolgt ist. Das Künstlerische und damit die 
Gültigkeit seiner Texte bestehen darin, dass sie eine eigene Sicht auf die Welt ent- 
wickeln, das heißt bei aller Vielzahl der Bezüge ein Anliegen hatten, das durchaus 
nicht nur auf vielseitige Bildung zielte. Die Fähigkeit des menschlichen Schreibens 
könnte man vielleicht als Fähigkeit zur Obsession bezeichnen, und damit auch als 
Kraft, die einmal empfundene Konzentration / Obsession als Vorsatz um keinen 
Preis fahren zu lassen, sondern sie ein Leben hindurch zu hegen und zu pflegen und 
auf diese Weise zu einer künstlerisch werdenden Fixierung zu steigern. 


26 Zu Kraus: „Nachfolger“ und „Schüler“ Elias Canetti: Anne D. Peiter, „Comic citation as Subver- 
sion. Intertextuality in ‚Die Blendung‘ und ‚Masse und Macht‘, in The worlds of Elias Canetti, hg. von 
William Collins Donahue/Julian Preece, London 2008, 171-186. 
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Das ist von maschinellen Intelligenzen nicht leicht nachzumachen, denn es 
fehlt ihnen der zweite Aspekt, der dem ersten auf dem Fuße folgt: Die obsessive 
Verfolgung eines Interesses, die dem Schreiben peu a peu eigene, unverkennbare 
Konturen verleiht, speist sich aus einem existentiellen Anliegen, und dieses Anlie- 
gen wirft die Frage nach dem Zusammenhang von Text, Geltung und Leben auf.” 

Nehmen wir daher ein drittes Beispiel. Erst war vom Mainstream die Rede 
gewesen, dann von den Herausforderungen einer Komik, die intertextuell verfährt. 
Als neuen Aspekt soll es jetzt um Autobiographisches gehen, das heißt um den 
Nexus zwischen Erlebtem und Erschriebenem. 


4 Geltung und autobiographischer Pakt 


Gehen wir auch hier zunächst einmal mit der gebotenen Nüchternheit vor. Es soll 
hier ein Beispiel ins Zentrum treten, das die Frage nach der Imitier- und Erlern- 
barkeit autobiographischen, also irgendwie doch existentiell aufgeladenem 
Schreibens aufwirft. 

In den 1980er Jahren erschien im angesehen Jüdischen Verlag die Autobio- 
graphie eines Shoah-Überlebenden, der in Polen als Kleinkind den Massakern 
entgangen war. Jahrzehnte später schrieb dieser Mann seine Erinnerungen in 
fragmentarisch bruchstückhaften Bildern erfahrener Gewalt fest und wurde so- 
dann von der Literaturkritik als neue, für die Geschichte verfolgter Kinder wichtige 
Stimme rezipiert. Durch die kritische Arbeit von Historiker:innen stellte sich jedoch 
heraus, dass der Autor dieses Schicksal gar nicht wirklich erlebt hatte. Vielmehr 
hatte er eine Kindheit hinter sich, die aus sozialen Gründen extrem schwierig und 
bindungslos gewesen war, ohne jedoch mit der Shoah auch nur entfernt zu tun zu 
haben.” 

Dieser Fall ist für die Frage nach der Gültigkeit von Texten von paradigmati- 
scher Bedeutung. Offenbar ist es so, dass sogar bei erinnerungspolitisch so sensiblen 


27 Erneut zum „Paradigma Kraus“: Anne D. Peiter, „Un critique clairvoyant de la langue du 
Troisième Reich ou un ‚Goebbels par esprit‘? Le rapport de Pauteur satirique Karl Kraus a la judeite 
et l’antisémitisme du tournant du siècle a sa mort“, in Identités juives en Europe centrale. Des Lu- 
mières a l’entre-deux-guerres, hg. von Daniel Baric, Bordeaux 2014, 203-215. 

28 Gemeint ist der Roman von Binjamin Wilkomirski, Bruchstücke. Aus einer Kindheit 1939-1948, 
Frankfurt a. M. 1995. - Anders gelagert, da zugleich für eine politische Einflussnahme genutzt, ist der 
Fall von Fabian Wolff, der sich lange Jahre „als Jude“ in der Öffentlichkeit zu Worte meldete, bis er 
eingestehen musste, gar nicht jüdischer Herkunft zu sein. Zu der Debatte um diese angemasste 
Identität vgl. etwa: Fundiert spekuliert, in [wwwtaz.de/Medien-Affaere-Fabian-Wolff/!5944149/] 
(Zugriff: 23.08.2023). 
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Themen wie der nationalsozialistischen Vernichtungspolitik bestimmte Topoi 
greifen, die, wenn sie erzählend aufgerufen werden, bei einer gutwilligen Leser- 
schaft den Eindruck hervorrufen, in sich und gleichzeitig auch historisch „stimmig“ 
zu sein. Das aber legt den irritierenden Schluss nahe, dass sogar die Katastro- 
phenliteratur „erlern-“ und „nachahmbar“ ist.” 

Im Fall von Bruno Dössekker alias Binjamin Wilkomirski war es so, dass er 
Unterstiitzung fand durch eine andere vermeintliche Uberlebende, die behaupte- 
ten, ihn damals als Kind gekannt zu haben. Fiktionen schlossen sich an Fiktionen, 
ein regelrechtes Stützgewölbe wurde aufgerichtet, in dem ein Text den anderen im 
Fall beglaubigte, und zwar jenseits aller Realitäten. 

Die juristische Schwierigkeit lag im weiteren Verlauf des Skandals darin, dass es 
durchaus zweifelhaft war, ob der Autor willentlich gelogen hatte. Fest stand, dass er 
ein tief traumatisierter Mann war, der wirklich, wenn auch in völlig anderen 
Kontexten als behauptet, Leid erfahren hatte. 

Dennoch blieb ein Problem bestehen, das bei der Auseinandersetzung mit dem 
Fall als Problem des „autobiographischen Paktes“ bezeichnet worden ist. Dieser von 
dem Literaturwissenschaftler Philippe Lejeune geprägte Ausdruck bezeichnet die 
Tatsache, dass die Gattung, der ein Text zugeordnet wird, eine bestimmte Leser- 
haltung, das heißt eine Erwartung hervorbringt, die von Seiten des Schreibenden 
nicht getäuscht werden darf. Wenn jemand behauptet, sein Leben zu erzählen, 
dann dürfen ihm zwar Fehler und Ungenauigkeiten bei der Erinnerung passieren, 
doch erwartet wird zugleich, dass es bei diesem Umgang mit „Dichtung und 
Wahrheit“ redlich zugehe, das heift dass das Vertrauen, das die Leserschaft dem 
Text entgegenbringt, nicht bewusst getäuscht werde. Genau diese implizite Abma- 
chung - also der Pakt - schien aber im zitierten Fall missachtet worden zu sein, mit 
allen erinnerungspolitischen Konsequenzen, die dies gerade in Bezug auf die ne- 
gationistische Suche nach „Beweisen“ für die „Existenz von Auschwitz“ haben 
musste. 

Ausgehend von der Empörung, die sich nach der Fahrlässigkeit des zum 
Suhrkamp-Verlag gehörenden Jüdischen Bahn brach,” wäre nun mit Blick auf die 
KI die Frage zu stellen, wie noch weiter über die großen Menschheitskatastrophe 
geschrieben werden kann, wenn die Erfindung scheinbar katastrophenkonformer 
Lebensgeschichten maschinell betrieben und buchmarktgerecht aufbereitet wer- 
den kann. In welches Verhältnis geraten dann Leben und Schreiben, Ego-Dokument 


29 Zur Katastrophenliteratur allgemein: Anne D. Peiter/Marion Picker, „Apres la crise — ‚Guerra è 
sempre.‘ Sur Pimpossibilite de l ‚apres‘ des catastrophes“, in After the crisis, hg. von Ludivine 
Thouverez [im Druck]. 

30 Eine Zusammenfassung zu diesen Debatten findet sich auf Wikipedia, in [https://de.wikipedia. 
org/wiki/Binjamin_Wilkomirski] (Zugriff: 23.08.2023). 
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und Erfindung, reales und fiktives Ich, tatsächliches Leid und fälschlich bean- 
spruchte „Opferkonkurrenz“? 

Leicht zu beantworten ist diese Frage nicht, denn es gibt Autoren wie den 
ungarischen Literaturnobelpreisträger Imre Kertesz, der dafür plädiert, das 
Schreiben über Auschwitz müsse auf dessen literarische Neuerfindung hinauslau- 
fen.?' Nicht Bericht sei abzulegen darüber, wie dies und das genau gewesen sei. 
Vielmehr erstehe die Vernichtungsmaschinerie der Nationalsozialisten in der Li- 
teratur in eigenen, quasi erfundenen Formen wieder auf. 

Kertesz sieht also seine Texte durchaus nicht nur als autobiographische an. 
Vielmehr ist es auch bei ihm eine untergründig-verstörende Komik, die die Leser- 
schaft davon abhält, eingeschliffene, autobiographische Muster der Shoah-Literatur 
zu identifizieren und an ihnen Halt zu finden. Literarisches Sprechen über sich 
wird bei Kertesz zu einer haltlosen Sache in dem Sinne, dass gerade hinter das 
Wissen über Auschwitz zurückgegangen und die Naivität einer Stimme hörbar 
gemacht wird, die noch nicht weiß, wie es sein wird.” Eine „Normalität“ der Ver- 
nichtung wird durch den willentlichen Mitvollzug der verschiedenen, eskalieren- 
den Schritte plausibel gemacht, die weit schockierender ist als die erkennbar ent- 
rüstete Haltung darüber, dass dies hat geschehen können. Geschehen eben ist es, die 
Opfer sahen sich hineingezogen in die neue Realität, und genau dagegen meldet 
zum Beispiel der Protagonist im „Roman eines Schicksallosen“ keinen Protest an. 
Nichts könnte verstörender sein als diese Quasi-Affirmation dem Ungeheuerlichs- 
ten gegenüber, nichts irritierender als das Wuchern der Worte „natürlich“ und 
„selbstverständlich“, mit denen der Ich-Erzähler die Verbrechen zu qualifizieren 
pflegt. 

Wenn die KI sich dieser Themen annehmen würde, könnte sie Mainstream- 
haftes ähnlich leicht hervorbringen, wie bei der anderen, eingangs erwähnten 
Katastrophenliteratur, nämlich der zum Atomkrieg. Die Standardisierung des au- 
tobiographischen Sprechens zur Shoah ist so weit fortgeschritten, dass sie mittel- 
fristig für die KI erlernbar sein dürfte. Als Beweis für diese These können die In- 
terviewtechniken dienen, die im so genannten „Spielberg-Projekt* der 
massenhaften Befragung der letzten, noch lebenden Zeug:innen zum Einsatz ka- 
men.”® 

Doch damit ragt das Problem der Gültigkeit solcher Texte natürlich wie der 
Balken, der im Fall von Wilkomirski schon ohne die KI im Auge der Leserschaft 


31 Das berühmteste Buch von Kertész, das dieser Maxime folgt ist das Folgende: Imre Kertész, 
Roman eines Schicksallosen, Reinbek b. Hamburg 2002. 

32 Dazu: Anne D. Peiter, „Heimweh nach Auschwitz“, in Rire, Mémoire, Shoah, hg. von Andrea 
Lauterwein, Paris/Tel Aviv 2009, 197-208. 

33 [https:/sfi.usc.edu/collecting] (Zugriff: 23.08.2023). 
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steckte, in die erinnerungspolitischen Debatten hinein. Da die „Entwirklichung“ von 
Geschichte, wie sie während der Corona-Pandemie bei verschwörungsmythisch 
motivierten Protesten mit ihrem „Impfen macht frei“, ihrer Beschwörung eines 
neuen, viral begründeten „Genozids“ und ihren Davidsternen mit der Inschrift 
„ungeimpft“ international hat beobachtet werden können, weit fortgeschritten ist, 
steht Schlimmes zu befürchten. 

Es reicht aus, hier kurz an den Skandal um den Spiegeljournalisten Claas Re- 
lotius und seine mal völlig realitätslosen, mal Erfindung und Realität mischenden 
Reportagen zu erinnern,‘ um vorauszusagen, dass sich Lejeunes „autobiographi- 
scher Pakt“ in Zukunft KI-bedingten Härtetests ausgesetzt sehen wird, die alles 
bisher Bekannte, Skandalträchtige bei weitem in den Schatten zu stellen drohen. 

Ich vermute, dass die Literaturwissenschaft und -kritik gehalten sein wird, eine 
Annäherungsweise wieder stark zu machen, die in den 1950er Jahren vorherrschte, 
um sodann jahrzehntelang als einseitig und überkommen zu gelten. Damals war es 
üblich gewesen, autobiographische Zugänge zu Texten zu entwickeln. Die Genese 
und Bedeutung derselben wurden demnach aus dem Leben eines Autors oder eine 
Autorin heraus erklärt. Selbstverständlich ist es heute unmöglich, diese Interpre- 
tationstechniken neu aufzulegen, so als sei inzwischen nichts anderes gedacht 
worden. Doch immerhin könnte es sein, dass der Frage „Wer spricht hier eigent- 
lich?“ neue Bedeutung zuwächst. 

Ein Experiment, das ich einst mit Studierenden unternommen habe, mag er- 
klären, was ich damit meine. Ausgeteilt worden war ein Auszug aus dem Roman 
„Michael“, geschrieben von Joseph Goebbels, als er noch kein Propagandaminister, 
sondern eifriger Lerner auf dem Weg zu diesem Posten war. Der Autorname wurde 
den Studierenden nicht mitgeteilt. Dem Auszug waren verschiedene, sämtlich er- 
fundene literaturwissenschaftliche Einschätzungen beigegeben, die sich alle stark 
voneinander unterschieden. 

Die Studierenden hatten nun die Aufgabe, zu begründen, welche Interpretation 
ihnen als die einleuchtendste erschien. Es stellte sich heraus, dass der Gedanke, es 
könne sich um einen kriegsverherrlichenden Text handeln, mehrheitlich ausge- 
schlossen wurde. Privilegiert sahen sich die Interpretationen, die dem Text Wert 
zusprachen, ihn anerkannten, die positiven Urteile der vermeintlichen Literatur- 
wissenschaftler:innen bestätigten. 

Dies zeugt nun einerseits davon, dass Studierende nicht so leicht damit rech- 
nen, die Lehrenden könnten ihnen Texte von mindestens zweifelhaftem, ideologi- 
schem Gehalt vorlegen. Der Griff in die aufgeklappte Interpretations-Kiste spiegelte 
also in einem ersten Schritt etwas von der Autorität und dem Glauben an die Au- 


34 Näheres auf Wikipedia, in [www.//de.wikipedia.org/wiki/Claas_Relotius] (Zugriff: 23.08.2023). 
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torität, die die Studierenden den Lehrenden und ihrem literarischen Geschmack 
zugestanden. 

Andererseits legte das Experiment die Tatsache offen, dass die Interpretation 
eines Textes ganz ohne biographische Informationen schwerlich operativ werden 
kann. Die Leseerwartung wird nicht nur im Fall von autobiographischen Texten 
durch die Meta-Texte, wie sie zum Beispiel in Form von Buchcovern und Klappen- 
Infos zum Leben und Werdegang der Schreibenden in Erscheinung treten, ge- 
steuert. Vielmehr scheint ein zumindest minimales Wissen zu der Frage, wer da 
schreibe, je vorausgesetzt und auch erwünscht zu sein. 

Wenn nun in Zukunft wird geschrieben werden können, ohne dass es noch zu 
einer körperlich-menschlichen Bindung des Textes an einen konkreten Schreiben- 
den kommt, wird sich eine Tendenz verstärken, die das, was beim Spiegel-Skandal 
deutlich geworden ist, noch einmal in neue Extreme treibt. Einerseits werden sich 
autobiographische Fiktionen stör-, komik- und überraschungslos nach bewährten 
Mustern herstellen und konsumieren lassen können. Andererseits aber droht die- 
ser Konsum mit einer Entwertung jedes Anspruchs auf die „Wahrheit“ in allem 
Dichterischen einherzugehen, das heißt die Tendenz zur „Entwirklichung“, wie sie 
ohnehin allenthalben beobachtet werden kann, zu verstärken. 


5 Zusammenfassung und ein Ausblick 


Zusammenfassend lässt sich sagen, dass das Lernen an und mit anderen Texten 
literaturgeschichtlich nichts Neues ist und die KI hier eigentlich nur Dinge fort- 
setzen wird, die über lange Zeiträume eher die Regel denn die Ausnahme waren. Es 
reicht, an die Regelpoetiken und die Idee zurückzudenken, Literatur sei erlernbar, 
um zu zeigen, dass der Geniekult, der dagegen die „ursprungslose“ Schöpfungs- 
Kraft des Einzelnen zu setzen versuchte, nicht das einzig gültige Prozedere dar- 
stellte, um Literatur zu schaffen. Kurz: Intertextualität und Lernen von Vorgän- 
gertexten, ihre Ver- und Einarbeitung, ihre Nutzung oder auch die Abwehr ihnen 
gegenüber sind Dinge, die wir aus der Literaturgeschichte kennen und die auch bei 
der KI funktionieren. 

Andererseits ist prognostizierbar, dass die KI bestimmte Dinge nicht kann. Sie 
wird gefüttert, und sie nimmt alles, was man ihr bietet, alles, was man in sie ein- 
speist. Das ist viel. Viel mehr, als all das, was ein Mensch in seinem Leben je wird 
lesen können. Zwar wählt auch die KI notwendig aus, und die Auswahl wird durch 
die Kooperation zwischen Mensch und „Maschine“ verstärkt; doch die letztere wird 
nie die Einseitigkeit entwickeln können, die gerade das Menschliche der lebenden 
Person ausmacht, die zum Stift greift. 


288 — AnneD. Peiter 


Und damit möchte ich abschließend zum Anfang und der Definition von Frei- 
heit als dem Unvorhersehbaren zurückkommen. Literaturwissenschaftliche Zu- 
gänge zu Texten können zwar bestimmte Methoden entwickeln, um das Gesagte zu 
verstehen, doch sie müssen offen und lernbereit bleiben, weil sie nur so die Ori- 
ginalität von Texten, die es so noch nicht gab, fasslich machen können. Der mög- 
lichen Überraschungshaltigkeit von Literatur folgt die Überraschungsoffenheit ih- 
rer Deutungsversuche auf dem Fuße. Freiheit also im Schreiben wie im Rezipieren, 
als Hinwendung zum Unerwarteten. 

Inwieweit die KI in der Lage sein wird, im komplexen Ineinander von „Welt“ 
und „Schreiben“ einen Blick zu entwickeln, der ungewohnt ist, nicht nur in Hinblick 
auf den Plot, sondern auch und ganz besonders in Bezug auf die Form, also das 
„Wie“ des Erzählens, wird in Zukunft zu beobachten sein. Dass die Demonstratio- 
nen in Hollywood,” die auch von Drehbuchautor:innen getragen werden, gute 
Gründe haben, die Konkurrenz der KI zu fürchten, dürfte durch das Beispiel der 
Science-fiction-Texte zum Atomkrieg, ihrer Beharrungskräfte und ihrer mehrheit- 
lichen Ungerührt- und Unberührtheit von kriegerischen Wirklichkeiten deutlich 
geworden sein. 

Dass umgekehrt die Freiheit von Literatur in Brechungen - zum Beispiel in der 
komischen Verzerrung - von Vorbildern und Mustern bestehen kann, scheint mir 
gleichfalls plausibel zu sein. Nicht alle Formen von Komik sind schwer zu ent- 
schlüsseln, nicht alle Formen reflektieren auf sich und ihre subversiven Möglich- 
keiten. 

Doch vielleicht liegt hier - wie am Beispiel von Imre Kertész gezeigt - die 
Möglichkeit einer Affirmation von Mustern beschlossen, in der gerade ihr Gegenteil 
aufscheint. Es gibt eine Art der Übernahme von Mustern, die gerade in dieser 
Nachahmung den Bruch erzeugt. Wenn also im Plot Dinge gar zu erwartungsgemäß 
verlaufen, wenn gar hingenommen wird, dass sie erwartungsgemäß verlaufen — 
selbst dann, wenn im Erwartungshorizont von Leserinnen und Lesern Signale der 
moralischen Entrüstung verlangt werden gegen die Normalisierung von durchaus 
Schrecklichem -, dann ist Irritation und Neues gegeben, dann bewährt sich die im 
eigentlichen Sinne literarische Erfindungskraft. 

An dieser Stelle treten Fragen einer gleichsam literarischen „Moral“ ins Blick- 
feld, doch wie wir mit diesen Fragen umgehen, das wird von der Wachheit unserer 
Rezeption abhängen und von unserer Lust, weiter Menschen und ihren Erfah- 
rungswelten zuzuhören. 


35 [www.organiser.org/2023/05/03/172138/world/chatgpt-row-hollywood-writers-protest-against-arti 
ficial-intelligence-claiming-its-taking-away-their-jobs/] (Zugriff: 23.08.2023). 


V Recht, Regulierung und normative Ordnungen 


Oliver Bendel 
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Abstract: This chapter deals with Al-based text generators from an ethical point of 
view. It begins with a brief overview of generative AI (section 2) and Al-based text 
generators in particular. This is followed by a compilation of relevant areas of 
applied ethics (section 3), especially information ethics and its relatives, and then a 
structured, detailed ethical discussion (section 4). Opportunities and risks of ope- 
ration and use are addressed. The chapter concludes with a summary and outlook 
(section 5). Overall, numerous risks are identified, as well as opportunities such as 
supporting work. The transformative potential for an important part ofthe creative 
and scientific professions is obvious. Itis clearly asecond wave of digitization that is 
taking hold. 


1 Einführung 


Die Disziplin der Künstlichen Intelligenz (KI) hat seit ihrer Gründung in den 1950er- 
Jahren viele Höhen und Tiefen erlebt. Um das Jahr 2000 herum herrschte unter 
ihren Vertretern verbreitet Pessimismus. Die Fortschritte bei bestimmten Formen 
künstlicher Intelligenz, etwa bei Übersetzungsprogrammen, deuteten jedoch eine 
Renaissance an. Ab 2020 erregten Sprachmodelle zumindest die Aufmerksamkeit 
von Experten. Der Durchbruch kam, als OpenAl im Jahre 2022 den Bildgenerator 
DALL-E 2 aufschaltete und den Chatbot und Textgenerator ChatGPT der Allge- 
meinheit zur Verfügung stellte. Ihnen folgten bald etliche Anwendungen generati- 
ver KI. Insbesondere KI-gestützte Text- und Bildgeneratoren werden heute privat 
und beruflich häufig verwendet, mehr und mehr auch Videogeneratoren. Dabei 
ergeben sich in Arbeitswissenschaft, Sozialwissenschaft und Ethik vielfältige Fra- 
gen. 

Der Blick aus der Perspektive der Ethik fällt bei generativer KI, wenn man die 
Literatur studiert, vor allem auf Textgeneratoren. Als Anwendungsgebiete sind 
hierbei die Wissenschaft oder die Wirtschaft im Fokus.’ Zudem interessieren Aus- 
und Weiterbildung hinsichtlich der Textproduktion. Die moralischen Implikationen 


1 Hazem Zohny et al., „Ethics of generative AI“, Journal of Medical Ethics, Bd. 49, 2023, 79-80; Steven 
C. H. Hoi, „Responsible AI for Trusted Al-powered Enterprise Platforms“, Proceedings of the Sixte- 
enth ACM International Conference on Web Search and Data, New York 2023. 
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von Bild- und Videogeneratoren sind vorrangig in den Medien ein Thema, zumal 
man mit den Resultaten — etwa Bildern von spärlich bekleideten jungen Frauen — 
gleich die Artikel schmücken kann.” Trotz der vorhandenen und zunehmenden 
Beschäftigung mit Textgeneratoren fehlen nach wie vor überzeugende systemati- 
sche Abhandlungen. Diese Lücke versucht dieser Beitrag ein Stück weit zu schlie- 
ßen. 

Der vorliegende Beitrag schafft zunächst in aller Kürze die Grundlagen zu ge- 
nerativer KI (Abschnitt 2), insbesondere zu KI-basierten Textgeneratoren. Es folgt 
eine Zusammenstellung der zuständigen Bereiche der angewandten Ethik (Ab- 
schnitt 3), vor allem der Informationsethik und ihrer Verwandten, und daraufhin 
eine strukturierte, ausführliche ethische Diskussion (Abschnitt 4). Dabei werden 
Chancen und Risiken des Betriebs und der Nutzung behandelt. Eine Zusammen- 
fassung mit Ausblick (Abschnitt 4) rundet den Beitrag ab. 


2 Grundlagen von Textgeneratoren 


In diesem Abschnitt werden KI-gestützte Textgeneratoren als Formen generativer 
KI erklärt und ihre Funktionen genannt. „Text“ bezieht sich auf das Format, das von 
ihnen ausgegeben wird, wobei auch Text (evtl. neben Bild) eingegeben werden kann. 
Es wird entsprechend geklärt, welche Form dieser annehmen kann, ohne dass dabei 
in die Tiefe gegangen wird. 

Textgeneratoren sind eine Ausprägung generativer KI. Im Englischen spricht 
man von „generative AI“, ein Wort, das ins Deutsche als „Generative AI“ über- 
nommen wurde.* Es handelt sich um einen Sammelbegriff für KI-basierte Systeme, 
mit denen auf scheinbar professionelle und kreative Weise alle möglichen Ergeb- 
nisse produziert (oder eben generiert) werden können, etwa Texte (Textgenerato- 
ren), Bilder (Bildgeneratoren) und Videos (Videogeneratoren), ferner Codes, For- 
meln, Simulationen etc.” Grundlage sind Eingaben der Benutzer, sogenannte 
Prompts. 

Bei Generative AI wird Machine Learning (maschinelles Lernen) verwendet, 
insbesondere Deep Learning, bei dem Big Data eine Rolle spielt, wobei unter- 


2 Adrian Lobe, „Sieht unheimlich echt aus! Wie die künstliche Intelligenz Erotik-Models überflüssig 
macht“, Luzerner Zeitung, 2023, in [https:/tip.de/95j15] (Zugriff: 28.09.2023). 

3 Amanda Hetler, „Pros and cons of Al-generated content“, TechTarget, 2023, in [wwwtechtarget. 
com/whatis/feature/Pros-and-cons-of-Al-generated-content] (Zugriff: 28.09.2023). 

4 „AI“ steht für „artificial intelligence“. 

5 Oliver Bendel, „Generative KI“, Gabler Wirtschaftslexikon, Wiesbaden 2023b, in [www.wirtschafts 
lexikon.gabler.de/definition/generative-ki-124952] (Zugriff: 28.09.2023). 
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schiedliche Datenquellen - vor allem Internetquellen wie Foren und Aggregatoren 
- und Trainingsmethoden herangezogen werden.° Bei Reinforcement Learning 
from Human Feedback (RLHF), einer Erweiterung des Reinforcement Learning, 
nutzt man die Klassifikation und Evaluation durch entsprechend instruierte 
menschliche Arbeitskräfte, die oft irgendwo auf der Welt schlecht bezahlt ihr Da- 
sein fristen. Mit deren Feedback wird ein Belohnungssystem trainiert, das wie- 
derum - um ein Beispiel zu nennen - einen Chatbot trainiert. 

Textgeneratoren wie ChatGPT können auf der Basis von text- und bildbasierten 
Prompts Texte aller Art erstellen, zusammenfassen und übersetzen, redigieren und 
paraphrasieren oder in Stil und Ausdruck verändern, u.a. Bücher, Studienarbeiten, 
Fachartikel, Werbetexte, Gedichte oder Rezepte. Dabei können sie über sich hin- 
auswachsen, dialogische Strukturen erlernen und zum Chatbot werden.’ Einen 
solchen kann man mit einem Text-to-Speech- und einem Speech-to-Text-System 
verbinden und in einen sozialen Roboter integrieren, der damit weitreichende 
natürlichsprachliche Fähigkeiten erlangt, oder in Suchmaschinen, wie es Microsoft 
und Google gemacht haben.® Seit 2023 verwendet man dafür verstärkt GPT-4 oder 
vergleichbare Sprachmodelle. 


3 Ausgewählte Bereiche der angewandten Ethik 


Dieser Abschnitt klärt in aller Kürze, was Ethik und speziell angewandte Ethik ist. 
Im Zusammenhang mit der angewandten Ethik geht er vor allem auf die klassischen 
Bereichsethiken ein. Dabei wird der Begriff der Informationsethik weit gefasst. Die 
Maschinenethik wird nicht als klassische Bereichsethik gesehen, sondern (ausge- 
hend vom Subjekt der Moral, das gerade in ihr freilich kein vollständiges ist, le- 
diglich ein abgeschautes und nachgebildetes) als Ethik neben der Menschenethik 
(der klassischen Ethik, die sich auf den Menschen als Subjekt richtet) beziehungs- 
weise als Sonderbereich der angewandten Ethik.’ 

Die Ethik ist eine Disziplin der Philosophie und entstand vor zweieinhalb 
Jahrtausenden, zunächst hauptsächlich auf der Grundlage der Werke von Aristo- 


6 Bendel 2023b. 

7 Ebd. 

8 Frederic Lardinois, „Microsoft launches the new Bing, with ChatGPT built in“, TechCrunch, 2023, in 
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teles,” eingebettet in eine fertile Phase antiker Hochkultur. Sie begründet und 
hinterfragt die Moral, zum Beispiel was als gut und böse beziehungsweise gerecht 
und ungerecht gilt. Dabei konzentriert sie sich auf das Handeln und nicht auf das 
Denken. Die angewandte Ethik bezieht sich auf mehr oder weniger klar abgrenz- 
bare Themenfelder und bildet bestimmte Bereichsethiken heraus, die im Wesent- 
lichen Reflexionsdisziplinen sind. Im vorliegenden Kontext sind Informationsethik, 
Technikethik, Medienethik und Wirtschaftsethik relevant. Zudem wird innerhalb 
der angewandten Ethik die Maschinenethik herangezogen. 

Technikethik bezieht sich auf moralische Fragen der Anwendung von Technik 
und Technologie, auf die Handlungen des Homo faber, des technischen Menschen." 
Sie kann sich mit Automobil- oder Waffentechnik ebenso befassen wie mit Nano- 
technologie oder Nukleartechnik. In der Informationsgesellschaft, in der immer 
mehr Produkte Computertechnologien enthalten und Services virtuell abgewickelt 
werden, ist die Technikethik besonders eng mit der Informationsethik verbunden 
und verschmilzt teilweise mit ihr. Nach einer anderen Definition ist die Informa- 
tionsethik ein Teil der Technikethik. Allerdings ist ihr Gegenstandsbereich inzwi- 
schen sehr groß, sodass viel für ihre Eigenständigkeit spricht. 

Die Moral der Informationsgesellschaft ist Gegenstand der Informationsethik.'? 
Diese erforscht, wie man sich - als Homo faber des Informationszeitalters — bei der 
Bereitstellung und Nutzung von Internetdiensten, Informations- und Kommunika- 
tionstechnologien (IKT), Informationssystemen, digitalen Medien, KI-Systemen und 
Robotern moralisch verhält beziehungsweise verhalten sollte.'? Sie ist im Zentrum 
der Bereichsethiken angesiedelt: Alle müssen sich mit ihr verständigen, da alle 
Anwendungsbereiche von computerbasierten Technologien durchdrungen sind. Die 
KI-Ethik kann als Teil der Informationsethik oder als eigenständiger Bereich be- 
trachtet werden, ebenso die Roboterethik. 

Der Gegenstand der Medienethik ist die Moral in den Medien und der Medien.'* 
Dabei interessieren sowohl die Methoden der Massenmedien und sozialen Medien 
als auch das Verhalten der Benutzer sozialer und digitaler Medien und ihre Rolle als 
Prosumenten (d.h. Produzenten und Konsumenten). Automatismen und Manipu- 
lationen durch KI-basierte Technologien und Systeme rücken in den Fokus und sind 
eng mit der Informationsethik verknüpft. Es erwachsen enge Verbindungen zur 


10 Oliver Bendel, 400 Keywords Informationsethik: Grundwissen aus Computer-, Netz- und Neue- 
Medien-Ethik sowie Maschinenethik, Wiesbaden 2019b. 
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Wirtschaftsethik, zumal sich die Medienlandschaft im Wandel befindet und der 
wirtschaftliche Druck wächst. 

Die Wirtschaftsethik beschäftigt sich mit der Moral in der Wirtschaft.’® Im 
Mittelpunkt steht das Individuum, das produziert, handelt, führt und ausführt so- 
wie konsumiert (Konsumentenethik), und das Unternehmen, das Verantwortung 
gegenüber Mitarbeitern, Kunden und der Umwelt trägt (Unternehmensethik). Da- 
mit sind auch Mikro- und Mesoebene angesprochen. Darüber hinaus sind die mo- 
ralischen Implikationen wirtschaftlicher Prozesse und Systeme sowie von Globa- 
lisierung und Monopolisierung von Interesse (Wirtschaftsethik mit Bezug zur 
Makroebene). In der Informationsgesellschaft ist die Wirtschaftsethik mit ihren 
Haupt- und Nebenzweigen eng mit der Informationsethik verwachsen. 

Gegenstand der Maschinenethik ist die Moral von Maschinen, meist die von 
teilautonomen und autonomen Systemen wie Chatbots, Sprachassistenten, be- 
stimmten Robotern, bestimmten Drohnen und selbstfahrenden Autos." In ihr und 
mit ihr entstehen sogenannte moralische Maschinen mit einer sogenannten 
künstlichen Moral. Meist implementiert man moralische Regeln, die strikt einge- 
halten werden. Es gibt zudem Ansätze mit Machine Learning, und bei der auf- 
kommenden Constitutional AI werden Sprachmodelle genutzt.'” Die Maschinen- 
ethik ist keine klassische Bereichsethik und mehr als eine Reflexionsdisziplin. Sie 
positioniert sich zwischen Philosophie auf der einen Seite und Informatik bezie- 
hungsweise Robotik auf der anderen. Wie diese technischen Disziplinen ist sie eine 
Gestaltungsdisziplin — sie untersucht, mit anderen Worten, nicht nur ihre Gegen- 
stände, sondern bringt sie auch (mit Hilfe technischer Mittel) hervor. 


4 Eine ethische Diskussion von Textgeneratoren 


In diesem Abschnitt werden ethische Fragen im Zusammenhang mit KI-basierten 
Textgeneratoren aufgeworfen. Dabei handelt es sich um eine Systematisierung von 
Überlegungen in der Literatur sowie um eigene Erkenntnisse, unter Fortführung 
früherer Arbeiten.'® Ferner bilden eigene Tests mit Textgeneratoren und Beob- 
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achtungen in den Communities eine Grundlage, wobei sie kaum repräsentativ sein 
können und die Tools sich mit ihren stochastischen Prozessen gerade dadurch 
auszeichnen, dass sie jedes Mal einen anderen Output liefern. Es kann sich um 
keine vollständige Liste von Themen handeln. Die Ausführungen des Autors an 
anderer Stelle werden zusammengefasst oder fortgeführt.'” 


4.1 Urheberrecht und Fremdnutzung 


Die Sprachmodelle, die Textgeneratoren zugrunde liegen, werden zu einem ge- 
wissen Anteil mit urheberrechtlich geschütztem Material trainiert. Dies ist aus 
rechtlicher wie aus ethischer Sicht problematisch.” So wird die Leistung eines 
Urhebers genutzt, ohne dass dieser um Erlaubnis gefragt, vergütet oder entschädigt 
wird.” Zudem hat man keinen Einfluss darauf, in welche Ergebnisse die eigenen 
Werke einfließen. Eventuell verstoßen sie gegen die eigenen Ziele, Ideen und Werte, 
oder sie verfehlen den eigenen Geschmack.”” Wenn es sich um geschütztes (und oft 
aufwändig erarbeitetes) Material von Unternehmen und Organisationen handelt, 
wird gegen deren wirtschaftliche und anderweitige Interessen verstoßen. Zudem 
haben sie kaum Einfluss darauf, in welche Resultate die entsprechenden Werke 
münden. So könnte sich die Konkurrenz in gewisser Weise und in unterschiedlicher 
Hinsicht an den Leistungen bereichern. Seit 2023 mehren sich die Klagen gegen 
Anbieter generativer KI, etwa von betroffenen oder angeblich betroffenen Autoren 
und Kiinstlern.”* 

Informationsethik und Medienethik widmen sich urheberrechtlichen Fragen 
und schöpferischen Prozessen rund um die Textgeneratoren.”* Die Wirtschaftsethik 
untersucht die Verschiebungen, die sich durch die Rechtsverletzungen ergeben, u.a. 
den Aspekt des Missbrauchs durch die unentgeltliche und unrechtmäßige Nutzung 


19 Bendel 2023d und Bendel 2024 (s. unten Anm. 23). 

20 Jan Smits/Tijn Borghuis, „Generative AI and Intellectual Property Rights“, in Law and Artificial 
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21 Copyright Office, Copyright Registration Guidance: Works Containing Material Generated by 
Artificial Intelligence, 2023, in [https://tip.de/mdob8] (Zugriff: 28.09.2023). 

22 Oliver Bendel, „Generative KI aus ethischer Sicht“, in Generative Künstliche Intelligenz (KI) und 
Mensch-Maschine-Augmentation, hg. von Sabine Seufert/Siegfried Handschuh, Stuttgart (erscheint 
Februar 2024). 
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von Daten. Zudem ist die Rechtsethik im Spiel, zumal es sich um Grenzfragen im 
Recht handelt. 


4.2 Urheberschutz von Werken 


Mit Blick auf Textgeneratoren wird diskutiert, in einem jeweils unterschiedlichen 
rechtlichen Rahmen, ob die damit verfertigten Texte Urheberschutz erhalten kön- 
nen.’ Wenn ausreichende menschliche Beteiligung vorhanden ist, bei einer ge- 
wissen Schöpfungs- oder Gestaltungshöhe, kann dies im Prinzip der Fall sein.”° 
Möglicherweise reichen schon spezifische Prompts dafür aus, dass ein Urheber- 
schutz entsteht, oder ein komplexes System davon, wie es für Romane oder Sach- 
bücher notwendig ist.” Hier wären dann die Inputs selbst und die durch sie ver- 
ursachten Werke schützenswert. Zudem kann eine nachträgliche Bearbeitung von 
KI-Werken durch Autoren oder Lektoren dazu führen, etwa wenn diese Kapitel 
umschreiben respektive ergänzen. Es muss letztlich etwas Eigenständiges und Un- 
terscheidbares vorliegen. Auch ein Kuratieren kann wohl in Urheberschutz mün- 
den, wenn das damit gebildete Ganze als eigenes kreatives Werk angesehen werden 
kann.” Dazu gehören die Sammlung, die Anordnung und die Besprechung von 
Texten. 

Informationsethik und Medienethik widmen sich dem Schutz und der Eigen- 
ständigkeit oder Nichteigenständigkeit von Werken.” Die Wirtschaftsethik unter- 
sucht die Möglichkeiten und Missbräuche, die sich durch die Nutzung der Textge- 
neratoren — etwa durch Mitbewerber - ergeben. Zudem ist die Rechtsethik im Spiel, 
zumal es sich wiederum um Grenzfragen im Recht handelt. 
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4.3 Datenschutz und informationelle Autonomie bei Prompts 


Textgeneratoren verlangen meist nach text-, manchmal auch nach bildbasierten 
Prompts.’ Zuweilen kann man bei ihnen ganze Dokumente oder Bilder hochladen, 
auf die sie dann Bezug oder die sie als Ausgangsmaterial nehmen. Prompts verraten 
viel über die Gesinnung, die Interessen, den Geschmack und letztlich die Person des 
Benutzers, ganz abgesehen davon, dass häufig durch den Aufruf der Website Auf- 
enthaltsort, Betriebssystem, Browser etc. bekannt werden.” Darin ist der Vorgang 
den Eingaben in Suchmaschinen nicht unähnlich. Zudem können Prompts per- 
sönliche oder betriebliche Daten enthalten. So tippen Mitarbeiter etwa Kunden- 
daten ein oder Daten über das Unternehmen - eine Praxis, die schon zu etlichen 
betrieblichen Sperren in den USA und in Europa geführt hat.” Entsprechend 
werden teilweise Betriebsgeheimnisse und die informationelle Autonomie verletzt. 

Informationsethik und Medienethik werfen Fragen in Bezug auf den Daten- 
schutz, den Schutz von Bildern und die informationelle Autonomie bei der Eingabe 
von Prompts auf.” Die Wirtschaftsethik untersucht in moralischer Hinsicht die 
Möglichkeiten beim Handel von Prompts über Plattformen. Zudem ist die Rechts- 
ethik im Spiel, etwa in Bezug auf die Verletzung von Persönlichkeitsrechten. 


4.4 Verantwortung und Haftung 


Textgeneratoren können als teilautonome Systeme aufgefasst werden. Die Prompts 
der Benutzer führen dazu, dass sie etwas generieren, also autonom bearbeiten und 
automatisch erzeugen. Im Prinzip können sich Textgeneratoren in autonome Sys- 
teme verwandeln, etwa wenn die Prompts von der einen Maschine erstellt sowie 
übertragen und von der anderen Maschine - einer virtuellen wie im Falle von 
Textgeneratoren oder einer physischen wie im Falle eines Roboters — abgearbeitet 
werden. Einen auf einem Sprachmodell basierenden Chatbot, bei dem der Dialog in 
den Vordergrund rückt, kann man ebenfalls als autonom betrachten. Wie bei allen 
(teil-Jautonomen Maschinen ergeben sich Fragen zu Verantwortung im morali- 
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schen und rechtlichen Sinne und Haftung im rechtlichen Sinne.’* So kann ein Text, 
der Falschinformationen oder Halbwahrheiten enthält, im entsprechenden Kontext 
Schaden anrichten. Auch diskriminierende, rassistische und sexistische Aussagen 
werfen Fragen auf. 

Die Informationsethik (mitsamt KI-Ethik und Roboterethik) fragt nach der 
Verantwortung von KI-Systemen. Es herrscht Einigkeit darüber, dass diese keine 
Verantwortung tragen können.” Diese trägt stets der Mensch, wobei es sich um 
zahlreiche Entwickler, Vermittler und Betreiber handeln kann, die zudem schwer 
zu identifizieren sind. Die Rechtsethik mag zu anderen Schlüssen kommen und 
dabei helfen, eine elektronische Person zu etablieren, die eine Haftung im Zivil- 
rechtlichen übernehmen kann.’® 


4.5 Stereotype, diskriminierende, rassistische und sexistische 
Darstellungen 


Bei der Bias-Diskussion geht es um Vorurteile und Verzerrungen, die — absichtlich 
oder unabsichtlich - in die KI-Systeme einfließen und von diesen wiedergegeben 
werden. So reproduzieren manche Texte zum Beispiel Rollenklischees zu Frauen 
und Männern oder haben eine politische oder weltanschauliche Schlagseite. Eini- 
gen Programmen ist zudem eine kulturelle Voreingenommenheit zu eigen, insofern 
sie auf der englischen Sprache beruhen und die Texte zum Training zum größten 
Teil aus dem westlichen Kulturkreis stammen und generierte Outputs deshalb 
stereotype Konzepte widerspiegeln können.” Stereotype, Vorurteile und Verzer- 
rungen sind nicht per se ein Problem (beziehungsweise gehören in gewisser Weise 
zu unserem Alltag), können aber in Beleidigungen und Benachteiligungen münden. 
Zudem können sie, selbst wenn sie Wirklichkeit widerspiegeln, auch Wirklichkeit 
formen, und zwar in unerwünschter Weise. 

Informationsethik und Medienethik fragen nach dem Entstehen von Stereoty- 
pen und diskriminierenden, rassistischen und sexistischen Aussagen bei der Text- 
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national, 2022, 41-46, in [https:/tip.de/l62tn] (Zugriff: 28.09.2023). 

36 Susanne Beck, „Künstliche Intelligenz — ethische und rechtliche Herausforderungen“, in Philo- 
sophisches Handbuch Künstliche Intelligenz, hg. von Klaus Mainzer, 2020, in [https://link.springer. 
com/referenceworkentry/10.1007/978-3-658-23715-8_29-1] (Zugriff: 28.09.2023). 

37 Cris Martin P. Jacoba et al., „Bias and Non-Diversity of Big Data in Artificial Intelligence. Focus on 
Retinal Diseases“, 2023; Jorg Breithut, „Künstliche Intelligenz. Die Text-zu-Quatsch-Generatoren“, 
DER SPIEGEL, 2022, in [https://tlp.de/qte9h] (Zugriff: 28.09.2023). 
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generierung.*® Zudem ist die Rechtsethik im Spiel, etwa in Bezug auf die Diskri- 
minierung. Die Maschinenethik kann Methoden zur Begrenzung von Anfragen und 
zur Ausgabe von Inhalten bereitstellen, zum Beispiel Metaregeln und Restriktionen. 


4.6 Falschdarstellungen von Sachverhalten 


Textgeneratoren neigen auch in der zweiten und dritten Generation zum „Hallu- 
zinieren“, wie der mehr oder weniger anerkannte Fachbegriff für das Verbreiten 
von Unwahrheiten lautet. So tauchen nicht nur falsche Angaben im Text auf, etwa 
zu Personen und Unternehmen, sondern auch falsche Quellen, sofern welche - 
meist geschieht dies auf Anfrage — angegeben werden. Es werden zum Beispiel 
Webadressen erfunden, bei denen die Domain stimmt, der Pfad dagegen nicht. 
Neuere Generatoren beziehungsweise Versionen versuchen solche Fehler mit ver- 
schiedenen Strategien zu vermeiden. Sie fassen sich kürzer, greifen auf Angaben in 
ihren Wissensdatenbanken zurück oder auf Online- und Livedaten zu. Gerade eu- 
ropäische Anbieter wie Aleph Alpha aus Heidelberg werben mit solchen Ansätzen. 
Damit schränkt man zum Teil wiederum die Mächtigkeit der Sprachmodelle ein, die 
— so merkwürdig es klingt - nicht zuletzt in ihrer überbordenden Fantasie besteht. 

Informationsethik und Medienethik interessieren sich für Fälschungen, 
Falschdarstellungen und Falschinformationen im textuellen Bereich.” Die Politik- 
ethik untersucht die Implikationen im Politischen, etwa mit Blick auf die Schwä- 
chung der Demokratie, die Wirtschaftsethik diejenigen im Wirtschaftlichen. Zudem 
ist die Rechtsethik im Spiel, etwa in Bezug auf falsche Tatsachenbehauptungen, 
Rufmord und Ehrverletzung. 


4.7 Weigerungen, Zurückweisungen und Einschränkungen 
Bei vielen Textgeneratoren sind Restriktionen im Hinblick auf die Prompts vor- 


handen.“ Wenn diese bestimmte Stichwörter oder Aussagen expliziter oder sexu- 
eller Art enthalten, werden sie nicht ausgeführt." Damit werden (meist absichtlich 


38 Bendel 2023d. 
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hineinprogrammierte) moralische Regeln der Anbieter angewandt, ohne dass diese 
im Sinne des Benutzers sein müssten. Manche Anbieter berufen sich darauf, dass in 
verschiedenen Kulturen und bei verschiedenen Individuen unterschiedliche mo- 
ralische Vorstellungen existieren, denen man gerecht werden muss. Allerdings 
könnte man ja in seinem Account oder Profil vermerken, zu welcher Kultur oder 
Gruppe man gehört oder was man als Individuum will und erträgt, mit der damit 
eröffneten Option der Personalisierung. Solche Geschäftsmodelle sind aus vielen 
anderen und auch verwandten Bereichen bekannt, etwa von Chatbots wie Replika 
mit einer Adultvariante, bei der Dirty Talk und Rollenspiele aller Art möglich sind. 

Informationsethik und Medienethik interessieren sich in diesem Zusammen- 
hang für die Zensur der Textgeneratoren, die Wirtschaftsethik speziell für die 
Verweigerung von Dienstleistungen.” Zudem ist die Rechtsethik im Spiel, die 
Ubergriffigkeit und Beeinflussung beurteilen muss. Es werden moralische Regeln 
angewandt, sodass die Hersteller implizit oder explizit Maschinenethik treiben.” 
Sie werden dies fortführen, wenn sie Constitutional AI anwenden.”* 


4.8 Wissenschaftlichkeit und Referenzierbarkeit 


Ungeklärt ist das Problem, wie Texte von Textgeneratoren in journalistischen, 
belletristischen oder wissenschaftlichen Arbeiten und Artikeln verwendet werden 
können.” Wenn sie in diese ohne Verweis eingebaut werden, ist die Selbststän- 
digkeit der Leistung nicht mehr vorhanden. Wenn referenziert wird, ist die Frage, 
worauf - denn es handelt sich nicht um eine eigentliche Veröffentlichung, nicht 
einmal um graue Literatur.” Die Ergebnisse, die sich von Mal zu Mal ändern, be- 
kommt in der Regel nur der Benutzer angezeigt (lediglich bei Bildgeneratoren sind 
Communities verbreitet, wo man auch die Ergebnisse der anderen Mitglieder sieht, 
wie im Falle von Midjourney und Ideogram). Manche Verbände und Hochschulen 
schlagen vor, sie wie Aussagen aus einem persönlichen Gespräch zu verwenden und 
entsprechend darauf zu verweisen. So etwas ist jedoch in studentischen und wis- 
senschaftlichen Arbeiten sparsam zu verwenden. Zudem ist in diesem Zusam- 


um völlig unverfängliche Prompts handeln, die die generative KI in einer Weise umzusetzen be- 
ginnt, die sie selbst nicht zulässt. 
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menhang nach dem Sinn und Zweck von Zitaten zu fragen - diese sollen ja ei- 
gentlich die eigenen Ausführungen ergänzen und belegen, nicht ersetzen. 

Die Informationsethik beschäftigt sich mit den moralischen Implikationen der 
Integration computergenerierter Texte in Texte von Schülern, Studenten und Wis- 
senschaftlern, wie auch die Wissenschaftsethik, die die „neuen Plagiate“ — die 
vielleicht keine im rechtlichen Sinne sind, indes die Selbstständigkeit der Leistung 
aushebeln - untersucht, zudem die Veränderung der Originalität und Seriosität 
wissenschaftlicher Texte durch KI-Systeme. 


4.9 Verbesserung und Veränderung der Arbeit 


Textgeneratoren haben das Potenzial, Arbeit beziehungsweise Arbeitsergebnisse in 
inhaltlicher Hinsicht zu verbessern und zu verändern. Dies gilt für Journalisten, 
Autoren, Texter, zunächst aber für Laien (darunter Schüler und Studenten), die 
ohne einschlägige Fähigkeiten mit Hilfe geeigneter Prompts hochwertige und an- 
sprechende Werke in die Welt bringen können, die denen der genannten Profis 
ähneln. Sie erstellen Dokumente, Artikel und Bücher, bei genügender Kontrolle des 
Outputs. Zudem können sie mit dem KI-System brainstormen und sich eine Struktur 
vorschlagen lassen. Die Arbeit von Experten kann sich gravierend verändern.” Sie 
benötigen passende Prompts und damit in jedem Falle sprachliche und meta- 
sprachliche Fähigkeiten (die sie natürlich genauso auf entsprechenden Plattformen 
einkaufen können). Sie müssen die Werke nachbearbeiten, erweitern, zusam- 
menstreichen, neu anordnen etc., damit diese zum Kontext passen. Bei einigen wird 
all dies die Arbeit produktiver machen, bei anderen unproduktiver. Vermutlich hat 
die Arbeit nicht mehr die gleiche Eigenständigkeit, Vollständigkeit und Wertigkeit 
wie vorher. Das Ergebnis kann sich freilich auch verschlechtern, bei Laien wie bei 
Experten. 

Die Medienethik interessiert sich für die Verschiebungen bei den Kompetenzen 
der Texterstellung und -nutzung, wobei auch das Zusammenspiel von Text- und 
Bildgeneratoren von Bedeutung ist.** Die Wirtschaftsethik, insbesondere die Un- 
ternehmensethik, untersucht die Veränderung der Arbeit (nicht zuletzt der wis- 
senschaftlichen Arbeit und der Aus- und Weiterbildung) und der Arbeitsbezie- 
hungen. 


47 Thomas H. Davenport/Nitin Mittal, „How Generative AI Is Changing Creative Work“, Harvard 
Business Review, 2022, in [wwwhbr.org/2022/11/how-generative-ai-is-changing-creative-work] (Zu- 
griff: 28.09.2023). 
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4.10 Effizienzsteigerung bei der Arbeit 


Mit der Verbesserung und Veränderung der Arbeit hängen die Steigerung der 
Produktivität bzw. die Effizienzsteigerung zusammen. Man kann zum Beispiel als 
Student oder Wissenschaftler eine wesentlich größere Menge an Texten produzie- 
ren oder zusammenfassen und rezipieren. Von ähnlichen Effekten profitieren 
Texter und Werbefachleute, Marketing- und Kommunikationsabteilungen sowie 
Autoren, die mit Hilfe komplexer Prompts ganze Bücher erstellen können. Dies 
führt nicht zuletzt zu Zeit- und Kostenersparnis. Man bewältigt das Studium oder 
den Berufsalltag schneller und leichter. Zugleich wächst die Gefahr, dass unnötige 
und oberflächliche Arbeiten entstehen, die etwa das Wissenschaftssystem mit sei- 
nem Peer-Review an die Grenze der Belastbarkeit bringen. Auch die Effektivität, die 
in anderer Hinsicht bereits angesprochen wurde, lässt sich verbessern, etwa hin- 
sichtlich der korrekten Rechtschreibung, die von der Hochschule oder der Com- 
munity verlangt und bewertet wird, oder hinsichtlich der Sprache eines Organs. 

Die Medienethik interessiert sich wiederum für die Verschiebungen bei den 
Kompetenzen der Texterstellung und -nutzung. Die Wirtschaftsethik untersucht die 
Veränderung der Arbeit und der Arbeitsbeziehungen, die Wissenschaftsethik die 
Veränderung der wissenschaftlichen Arbeit und der Aus- und Weiterbildung, zu- 
dem die Überlastung des Wissenschaftssystems mit all ihren Konsequenzen. 


4.11 Ersetzung und Abschaffung der Arbeit 


Bereitstellung und Nutzung von Textgeneratoren gefährden im Extremfall ganze 
Berufe und Branchen. So ergeben sich Risiken für Journalisten, Autoren und Texter. 
Lange Zeit galten kreative und künstlerische Berufe als geschützt, was weder im 
Textbereich noch im Bildbereich mehr der Fall ist, zumindest dort nicht, wo Mas- 
senprodukte und Durchschnittsware ausreichen.*” Je nach Geschäftsmodell und je 
nach Verhalten von Privaten und Unternehmen werden etliche Betroffene ihre 
Arbeit einschränken müssen oder gar verlieren. Ebenso sind Marketing- und 
Werbeprofis sowie Abteilungen für Öffentlichkeitsarbeit und Kommunikation be- 
droht. Werbetexte, Wortmarken, CD-Vorlagen etc. lassen sich auf Knopfdruck rea- 
lisieren, wobei nicht unbedingt Spezialisten in diesem Bereich vonnöten sind, al- 
lenfalls für das Überprüfen und Genehmigen. Auch ganze Strategien, etwa zur 
Markteinführung eines Produkts, vermögen ChatGPT und Co., ein geschicktes 
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Prompten vorausgesetzt, zu entwickeln. Nicht zuletzt könnten Programmierer - 
also die Anwender künstlicher Sprachen - verdrängt werden.” 

Dieser Problematik widmet sich die Medienethik, etwa in Bezug auf die Ver- 
schiebung bei den Kompetenzen bei der Medienerstellung.°' Die Wirtschaftsethik, 
insbesondere die Unternehmensethik, untersucht die Ersetzung der Arbeit und die 
Entstehung von Arbeitslosigkeit in den kreativen und administrativen Berufen. 


4.12 Unselbstständigkeit des Menschen 


Als Taschenrechner in den 1980er-Jahren in den Schulen verteilt wurden, trat die 
Befürchtung auf, dass die Kinder und Jugendlichen das Rechnen verlernen und es 
als Erwachsene im Privat- und Berufsleben nicht mehr anwenden könnten.°” 
Textgeneratoren betreffen weniger das Rechnen, sondern mehr das Schreiben, eine 
andere Kulturtechnik, die sicherlich noch wesentlicher und grundlegender ist. Bei 
ihrer Nutzung fällt der Akt des Erarbeitens auf dem echten oder virtuellen Papier 
weg, der für viele Menschen einem lauten Nachdenken und einem erst vorsichtigen, 
dann immer sichereren Erkunden entspricht. Nun übernimmt das KI-System - nach 
einer recht kurzen Anweisung — sowohl Prozess als auch Resultat. Ohne großen 
Aufwand steht man vor einer erheblichen Menge von Text, die es nur noch händisch 
oder maschinell nachzubearbeiten gilt. Man könnte davon sprechen, dass die Un- 
selbständigkeit des Menschen durch den Gebrauch dieser Werkzeuge zunimmt. 

Die Technikethik stellt zusammen mit der Informationsethik die Frage, wie das 
Verhältnis von Mensch und Werkzeug ist, ob der Mensch durch die Technik gewinnt 
oder verliert und wie sich in diesem Zusammenhang die Kulturtechnik des 
Schreibens entwickelt und verändert." Die Informationsethik nimmt speziell die 
Zunahme der Unselbstständigkeit durch Textgeneratoren unter die Lupe, die mit 
der Zunahme der Automatisierung einhergeht. 


5 Zusammenfassung und Ausblick 


Im abschließenden Abschnitt erfolgen eine kurze Zusammenfassung und ein klei- 
ner Ausblick. Der vorliegende Beitrag gab zunächst eine Einführung zu Textgene- 


50 Patrick Hannemann, „ChatGPT gefährdet viele Berufe: Diese Jobs werden sich völlig verändern“, 
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ratoren. Dann wurden ethische und am Rande soziale und rechtliche Aspekte be- 
handelt. Es konnten insgesamt zahlreiche Risiken herausgearbeitet werden, jedoch 
auch Chancen wie die Unterstützung der Arbeit. Das Transformationspotenzial für 
einen wichtigen Bereich der kreativen und wissenschaftlichen Berufe wurde of- 
fensichtlich. Es handelt sich förmlich um eine zweite Digitalisierungswelle, die den 
Text erfasst. 

Weitere damit zusammenhängende Punkte sind ebenfalls von Interesse. So 
sind die meist textbasierten Prompts ein Grund, dem Kulturwerkzeug Sprache neue 
Aufmerksamkeit zu widmen.™ Gefragt sind äußerst präzise und prägnante Be- 
schreibungen, sodass die Sprachfähigkeit des Benutzers gefordert ist und geschult 
werden muss. Eine hier nicht behandelte Frage ist, wie damit umzugehen ist, dass 
Übersetzungs- und Redigierprogramme wie DeepL und DeepL Write sowie manche 
Textgeneratoren (auch amerikanischer Provenienz) häufig gegenderte Texte mit 
Gendersternchen oder Doppelpunkt im Wortinneren nicht als Fehler deklarieren 
oder sogar propagieren beziehungsweise produzieren — und damit die durch den 
Rechtschreibrat fixierte Normsprache schwächen.” 

Alle Themen können Gebieten der angewandten Ethik zugeordnet werden, die 
sich spezialisiert und eigene Begriffe (z.T. sogar eigene Methoden) herausgebildet 
haben, also den Bereichsethiken°° und der Maschinenethik.°” Natürlich sind ge- 
nauso Begriffe und Konzepte der allgemeinen, empirischen wie normativen Ethik 
relevant. So kann man mit der Menschenwürde argumentieren, die mit Texten 
verletzt wird, oder mit Gleichheit und Gleichberechtigung. Begriffe wie Diskrimi- 
nierung, Rassismus und Sexismus können auf die genannten Bereichsethiken be- 
zogen werden, haben aber eine Verankerung in der Ethik insgesamt und sind 
Thema weiterer Bereichsethiken wie der Politikethik. 

Neue Versionen von Sprachmodellen könnten die Mächtigkeit der Textgene- 
ratoren erhöhen. Es ist freilich damit zu rechnen, dass die Qualität abnimmt, wenn 
KI-Systeme immer mehr mit KI-Content trainiert werden. Es gibt unterschiedliche 
Möglichkeiten, dieser Gefahr zu begegnen, etwa durch die Hinzunahme von Bild- 
und Audiodaten und von Livedaten - sozusagen frisches Blut für den KI-Vampir. Die 
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Multimodalität von ChatGPT seit Herbst 2023 ist in genau diesem Sinne: Man kann 
mit der Anwendung sprechen und ihr Bilder zeigen (und von ihr das Dargestellte 
und damit zusammenhängende Hintergründe und Vorgänge erklären lassen). Eine 
andere Bedrohung ist, dass die Textgeneratoren zu sehr eingehegt werden, sei es 
aus rechtlichen, sei es aus ethischen oder moralischen Gründen. Es braucht zu- 
mindest Geschäftsmodelle, die auch riskante und explizite Ein- und Ausgaben er- 
lauben. Konkurrenz dürfte das Geschäft insgesamt beleben, und wenn mehr und 
mehr Open-Source-Generatoren entstehen, werden die Marktmacht der Konzerne 
und die damit einhergehende Abhängigkeit ein Stück weit zurückgedrängt. Die 
Risiken von Textgeneratoren sind erheblich, die Chancen aber so offensichtlich, 
dass Homo faber auf solche Werkzeuge kaum verzichten wird. 


Andreas Brenneis 
Normative Ordnungen für generative KI 


Eine selektive Bestandsaufnahme und Einordnung für den 
deutschen Hochschulkontext 


Abstract: The emergence of AI text generators has challenged the self-image and 
values of both science and society at large. Against the backdrop of new technolo- 
gical developments and their potential impacts, there are various normative fra- 
meworks that aim to respond to this challenge and provide guidance. This article 
introduces and contextualizes some of these discursive efforts relevant to the 
German university context. 


1 Einleitung 


Seit der Veröffentlichung von ChatGPT hat dieses Programm als Speerspitze einer 
Gruppe von generativen KI-Tools nahezu alle öffentlichen Diskussionsforen mit- 
bestimmt: Wissenschaftliche Publikationen, volks- und betriebswirtschaftliche 
Prognosen, die Beschreibung neuer Tätigkeiten (Stichwort: Prompt-Engineering) 
und darauf aufsetzender Berufsfelder, Auseinandersetzungen über Prüfungsfor- 
men und Kompetenzkataloge usw. Die Möglichkeiten der Textgenerierung durch KI 
rücken für den akademischen Diskurs Fragen nach dem Stellenwert von Texten und 
dem Selbstverständnis der Textproduktion in den Vordergrund. Dazu gehört etwa, 
welche Geltungsansprüche durch KI erzeugte Texte haben und inwiefern diese sich 
von menschgemachten Texten - bislang die einzige Form von Texten - unter- 
scheiden. Dies ist aufgrund epistemischer Ansprüche (wie der Orientierung an 
Wahrheit und Wahrhaftigkeit) insbesondere für den Bereich der wissenschaftli- 
chen Textproduktion und -rezeption - also für das, was die wissenschaftliche Dis- 
kursivität und Öffentlichkeit ausmacht, von großer und womöglich „disruptiver“ 
Bedeutung.’ 


1 Die Frage danach, wie „wissenschaftliche Diskurse“ durch KI-Textgeneratoren beeinflusst wer- 
den, erlaubt zumindest zwei Blickrichtungen: Einmal kann in den Blick kommen, wie Wissenschaft 
über die durch ChatGPT und Co. hervorgerufenen Neuerungen in die Analyse und Reflexion geht, 
wie also das Phänomen inklusive der Chancen und Risiken wissenschaftlich untersucht wird. Hierzu 
gehören Fragen danach, welche Untersuchungsgegenstände und -methoden angemessen sind (etwa 
aus sozial- oder bildungswissenschaftlicher Perspektive), aber auch, wie sich KI-Textgeneratoren 
verbessern lassen (insbesondere aus informatischer Perspektive). Die zweite Blickrichtung wendet 


8 Open Access. © 2024 bei den Autorinnen und Autoren, publiziert von De Gruyter. Dieses Werk ist 
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Im folgenden Beitrag nähere ich mich dem Thema der disruptiven Potentiale 
von generativer KI über den Umweg einiger Normordnungen und Ethik-Richtlinien 
zu KI, die aktuell diesen Diskurs in der deutschen Hochschullandschaft mitbe- 
stimmen.” Ich möchte die Kriterien beleuchten, mit denen die genannten Norm- 
ordnungen Textgeneratoren als KI-Anwendungen einordnen: Wie werden ihre 
Chancen und Risiken konzeptualisiert? Wo werden ggf. Grenzen für die Entwick- 
lung oder die Nutzung gezogen? Vor der Analyse einiger zentraler Normordnungen 
soll zunächst der Begriff der Normordnung selbst geklärt werden. Dies geschieht im 
nächsten Abschnitt. 


2 Was sind Normordnungen? 


Der Plural Normordnungen ist ein Inbegriff für eine bestimmte Gruppe von ma- 
nifesten Diskurselementen hinsichtlich eines Problemfeldes - für den hier the- 
matisierten Fall sind dies die Techniken der Künstlichen Intelligenz bzw, spezifi- 
scher, der generativen KI-Anwendungen und deren gesellschaftliche Folgen. Als 
diskursive Elemente zielen sie auf Wirksamkeit im Schnittfeld von Recht, Ethik, 
Technologie und Markt. Die Multikomplexität dieses Feldes zeigt sich insbesondere 
dann, wenn in einem der Bereiche gravierende Veränderungen vonstattengehen. 
Heute sind dies zumeist die letztgenannten Bereiche, also die Änderungen von 
Marktmechanismen und der Marktmacht einzelner Akteure oder das Aufkommen 
neuer Technologien (wie der Fall OpenAl und ChatGPT deutlich vor Augen führt). 
Das Recht und die Ethik sind demgegenüber zwei reflexiv agierende Domänen, die 
auf Veränderungen reagieren und Vorschläge oder Vorschriften dazu machen, wie 
diese Veränderungen mit den gesellschaftlichen Vorstellungen und Zielen in Ein- 
klang zu bringen sind. Das verbindende Element von Normordnungen besteht 
darin, dass diese eine Reflexion des Problem- bzw. Gegenstandsbereichs vornehmen 
und dabei explizit auf Werte und Normen rekurrieren. Und auch wenn es sich je- 
weils um diskursiv wirksame Elemente handelt, sind sie nicht alle auf die gleiche 


den Blick weg von der wissenschaftlichen Untersuchung des Gegenstands selbst und hin auf die 
Transformation der wissenschaftlichen Praxis durch die Möglichkeiten generativer KI. Dies betrifft 
das Selbstverständnis des Unternehmens der Wissenschaft und die damit einhergehende gesell- 
schaftliche Funktion sowie Rolle von Wissenschaft. Infrage steht in dieser Perspektive u. a., wie das 
Verhältnis von epistemischen und nicht-epistemischen Werten in den Prozessen von Forschung und 
Lehre durch die Möglichkeiten generativer KI verändert wird. 

2 Für eine interdisziplinäre Einordnung des disruptiven Potentials von KI für die Wissenschaft vgl. 
Carl Friedrich Gethmann et al. (Hg.), Künstliche Intelligenz in der Forschung. Neue Möglichkeiten und 
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Weise kodifiziert. Normordnungen umfassen vielmehr sehr verschiedene Dimen- 
sionen und unterschiedliche Abschichtungen. Dazu gehören normative Fixpunkte 
(mehr oder weniger umstritten), auf Praxisrelevanz abzielende Leitplanken (mehr 
oder weniger tauglich) und regulatorische Durchsetzungsmechanismen (mehr oder 
weniger effektiv). Unterscheiden lassen sich in heuristischer Absicht: 


(1) 


(2) 


(3) 


(4) 


(5) 


(6) 


(7) 


(8) 


(9) 


rechtliche Normen - also Gesetze und Vorschriften eines staatlichen Rechts- 
systems, inklusive Sanktionsmöglichkeiten bei Verstößen, 

internationale Verträge - regeln das Verhalten zwischen Staaten oder supra- 
nationalen Organisationen und können von der Allgemeinen Erklärung der 
Menschenrechte über Handelsabkommen bis zu Regeln des Konfliktverhaltens 
reichen und umfassen u.a. auch diplomatische Protokolle, 

ethische Prinzipien - die explizit in Form ethischer Theorien ausgearbeitet sind 
und genuin philosophische Ansprüche artikulieren, also Begründungen dar- 
stellen, 

moralische Ansichten und Gepflogenheiten — mithin die in Gesellschaften, 
Gemeinschaften oder Kulturen etablierten und tradierten Vorstellungen davon, 
was richtig und falsch, was geboten und verboten ist; die Gebräuche können 
den Status als Gewohnheitsrecht erlangen, 

soziale Normen - neben expliziten auch implizite und informelle Regeln und 
Erwartungen, die das Verhalten innerhalb bestimmter sozialer Gruppen, ins- 
besondere Gemeinschaften, über Traditionen, Üblichkeiten, Bräuche und ak- 
zeptierte Praktiken regeln, 

kulturelle Werte - spiegeln die größeren Linien an Überzeugungen einer Ge- 
sellschaft wider und bestimmen als Horizont sehr grundlegend die Formen der 
Wahrnehmung, der Interaktion und der Entscheidungsoptionen, 

religiöse Gebote und Gesetze - bilden in entsprechenden Gemeinschaften ei- 
nerseits die Richtschnur des Handelns und auch der reflektierenden Selbst- 
befragung, können aber auch rechtlich (z.B. kirchenrechtlich oder in Formen 
wie der Mizwot, der zehn Gebote oder der Scharia) kodifiziert sein, 

politische Ideale - bestimmen die Ansichten und Handlungen entsprechender 
Gruppen und wirken sich einerseits über Regierungshandlungen auf die Ge- 
staltung der Lebensbedingungen in Staaten und anderen, größer wie kleiner 
strukturierten Gliederungen aus; andererseits motivieren sie in paradigmati- 
scher Weise diskursive Auseinandersetzungen, 

Ethikkodizes und Berufsethiken — werden in bestimmten Berufen und Orga- 
nisationen festgelegt, um das Verhalten der Mitglieder in verbindlicher Weise 
zu lenken; Beispiele sind ingenieurwissenschaftliche, medizinische oder jour- 
nalistische Kodizes oder etwa auch die Regeln guter wissenschaftlicher Praxis. 
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Diese Dimensionen und Abschichtungen sind miteinander verbunden und können 
sich überschneiden, was ein komplexes Netzwerk normativer Orientierung schafft. 
Individuen und Gesellschaften beziehen hieraus für ihr tägliches Leben wie für 
weitreichende Fragen Orientierung. Offensichtlich ist es wesentlich für normative 
Ordnungen in dem hier dargestellten Sinn, dass einzelne Ordnungen sich auch 
widersprechen oder sich ergänzen können. In der Diskussion um KI-Textgenera- 
toren spielen nicht alle genannten Dimensionen die gleiche Rolle. Im Hinblick auf 
wissenschaftliche Diskurse sind mehrere der genannten Felder bedeutsam: 

Da ist zunächst das Recht inklusive der internationalen Verträge. Wie in allen 
Bereichen des öffentlichen Zusammenlebens sind rechtliche Normen auch für den 
Umgang mit und insbesondere das Inverkehrbringen von KI-Systemen von großer 
Relevanz. Dabei ist aktuell aber z.T. umstritten, welche schon existierenden Gesetze 
für das global mit absolut neuer Wucht auftretende Phänomen der Textgeneratoren 
hinreichend spezifisch formuliert sind und wo weiterer Regulierungsbedarf be- 
steht. Diese Diskussion wird gerade sehr eindringlich geführt und staatliche wie 
supranationale Akteure zielen auf eine Regulierung u.a. durch internationale 
Verordnungen und Verträge wie die KI-Verordnung. Aber auch die Prüfungsord- 
nungen einzelner Hochschulen bzw. Studiengänge werden aktuell vielerorts dis- 
kutiert und zukünftig neu ausgehandelt. 

Neben dem Recht sind auch weichere normative Ordnungen diskursprägend. 
Hier sind die zahlreich erscheinenden Ethikkodizes, Positions- und Diskussions- 
papiere sowie berufsethischen Richtlinien zu nennen - die in der Regel wiederum 
explizit auf ethischen Prinzipien aufsetzen. Aus diesen normativen Debattenbei- 
trägen speist sich die diskursive Gemengelage. Für das Selbstverständnis der Wis- 
senschaft sind berufsethische Selbstverpflichtungen hinsichtlich von KI-Textgene- 
ratoren (z.B. durch eine Erweiterung der Regeln guter wissenschaftlicher Praxis) 
für eine Einbettung der disruptiven bzw. transformativen Prozesse in der Wissen- 
schaft selbst von Bedeutung. Daneben gibt es in Arbeitsgruppen, Instituten und 
Fachbereichen sowie auf Workshops, Tagungen und Konferenzen zahlreiche An- 
sätze zu einer Selbstverständigung über den Umgang mit generativer KI. 

Im Folgenden werden verschiedene Typen von Normordnungen mit ihren 
wesentlichen Aussagen zu KI-Textgeneratoren vorgestellt.” Den Beginn machen 


3 Neben den hier diskutierten normativen Ansätzen gibt es zahlreiche weitere Texte und Initiati- 
ven, die zu besprechen wären. In erster Linie ist hier der Entwurf der Europäischen Kommission zu 
einer Verordnung über Künstliche Intelligenz zu nennen, der seit April 2021 vorliegt und in dem KI- 
Anwendungen im Bildungsbereich als hochriskant eingestuft werden und die damit nur mit hohen 
regulatorischen Hürden eine Zulassung für den europäischen Markt erhalten würden. Vgl. Euro- 
päische Kommission, „Vorschlag für eine KI-Verordnung“, 2021, in [https:/artificialintelligenceact. 
eu/the-act/] (Zugriff: 30.09.2023). Neben der KI-Verordnung werden aber auch viele weitere Vor- 
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zwei ausführliche Einordnungen beratender Gremien (Deutscher Ethikrat und 
Büro für Technikfolgen-Abschätzung beim Deutschen Bundestag), ihnen folgen vier 
auf das Hochschulwesen fokussierte Papiere, zunächst die Stellungnahme des DFG- 
Präsidiums und dann drei Ausführungen verschiedener Akteure der Hochschule 
(Deutsche Gesellschaft für Hochschuldidaktik, Hochschuldidaktische Arbeitsgruppe 
und Digital Literacy Lab). Abschließend wird das Rechtsgutachten von Prof. Hoeren 
nachgezeichnet. 


3 Darstellung zentraler Normordnungen zu 
KI-Textgeneratoren 


3.1 Deutscher Ethikrat 


Der Deutsche Ethikrat hat eine sehr umfangreiche Stellungnahme zu den Heraus- 
forderungen durch Künstliche Intelligenz herausgegeben.* In dem ersten Teil wird 
eine technische und philosophisch-begriffliche Grundlegung vorgelegt, in der bei- 


schläge öffentlich oder in Fachcommunitys diskutiert. Dazu gehören: Datenethikkommission der 
Bundesregierung, „Gutachten“, 2019, in [www.bmi.bund.de/SharedDocs/downloads/DE/publikatio 
nen/themen/it-digitalpolitik/gutachten-datenethikkommission.pdf] (Zugriff: 30.09.2023); AI Ethics 
Impact Group, „From Principles to Practice. An interdisciplinary Framework to operationalise AI 
ethics“, 2020, in [wwwai-ethics-impact.org/resource/blob/1961130/c6db9894ee73aefa489d6249f5ee2b 
9f/aieig-report-download-hb-data.pdf] (Zugriff: 30.09.2023); Wissenschaftsrat, „zum Wandel in den 
Wissenschaften durch datenintensive Forschung“, 2021, in [wwwwissenschaftsrat.de/download/ 
2020/866720.pdf] (Zugriff: 30.09.2023); UNESCO, „Recommendation on the Ethics of Artificial Intel- 
ligence“, 2021, in [https://unesdoc.unesco.org/ark:/48223/pf0000380455] (Zugriff: 30.09.2023). Die Liste 
lässt sich umfassend ergänzen, vgl. das AI Ethics Guidelines Global Inventory von AlgorithmWatch, 
in [https:/inventory.algorithmwatch.org/] (Zugriff: 30.09.2023). Auch einzelne Wissenschaftler:innen 
haben sich an der Debatte beteiligt, wiederum exemplarisch sei hier genannt: Gabi Reinmann, 
»Wozu sind wir hier? Eine wertbasierte Reflexion und Diskussion zu ChatGPT in der Hochschul- 
lehre“, Impact Free 51, in [https://gabi-reinmann.de/wp-content/uploads/2023/02/Impact_Free_51.pdf] 
(Zugriff: 30.09.2023). In der Projektgruppe NOKI wurde am Zentrum verantwortungsbewusste Di- 
gitalisierung (ZEVEDI) für den Bereich der Forschungsethik eine Handreichung zu den Heraus- 
forderungen durch KI für die Forschung entwickelt: Zentrum verantwortungsbewusste Digitali- 
sierung (ZEVEDI), „Zur forschungsethischen Begutachtung von KI-Forschungsprojekten. 
Handreichung zur Unterstützung der Arbeit von Ethikkommissionen an Hochschulen“, Darmstadt 
2022, in [https://zevedi.de/wp-content/uploads/2022/11/ZEVEDI_Handreichung-KI-Forschungsethik_ 
2022.pdf] (Zugriff: 30.09.2023). 

4 Deutscher Ethikrat, „Mensch und Maschine — Herausforderungen durch Künstliche Intelligenz“, 
2023, in [wwwethikrat.org/fileadmin/Publikationen/Stellungnahmen/deutsch/stellungnahme-mensch- 
und-maschine.pdf] (Zugriff: 30.09.2023). 
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spielsweise das Phänomen der digitalen Durchdringung der menschlichen Le- 
benswelt, der anthropologische Aspekt verleiblichter Vernunft oder die Ambivalenz 
der Möglichkeiten einer Erweiterung und Verminderung menschlicher Autonomie 
und Autorschaft ausgeführt werden. Dabei liegt eine bewusste Entscheidung zu- 
grunde: Der Ethikrat analysiert die Konsequenzen der digitalen Entwicklungen für 
das menschliche Zusammenleben vor dem Hintergrund des menschlichen Selbst- 
verständnisses, das in den anthropologischen Grundbegriffen Vernunft, Intentio- 
nalität, Freiheit, Affektion durch Gründe, Handlung und Verantwortung seinen 
Ausdruck findet. Dadurch bilden grundlegende Überlegungen zu Mensch-Technik- 
Relationen die Basis für die normativen Bewertungen, wobei ein grundlegender 
Unterschied zwischen Menschen und Maschinen herausgestellt wird.’ Der Maßstab 
für die Bewertung algorithmischer Systeme wird durch die Weise definiert, in der 
die Delegation menschlicher Tätigkeiten an diese Systeme auf die zentralen an- 
thropologischen Merkmale/Systeme zurückwirkt und ob dabei menschliche Au- 
torschaft erweitert oder vermindert wird: 


Ziel der Delegation menschlicher Tätigkeiten an Maschinen sollte prinzipiell die Erweiterung 
menschlicher Handlungsfähigkeit und Autorschaft sein. Ihre Verminderung sowie eine Dif- 
fusion oder Evasion von Verantwortung gilt es hingegen zu verhindern. Dafür muss die 
Übertragung menschlicher Tätigkeiten auf KI-Systeme gegenüber den Betroffenen hinreichend 
transparent erfolgen, sodass wichtige Entscheidungselemente, -parameter oder -bedingungen 
nachvollziehbar bleiben.‘ 


Diese Überlegungen werden in einem zweiten Teil anhand ethischer Analysen zu 
vier Anwendungsdomänen konkretisiert, und zwar in den Bereichen Medizin, 
schulische Bildung, Öffentliche Kommunikation und Meinungsbildung sowie öf- 
fentliche Verwaltung.’ Ein dritter Teil widmet sich zehn Querschnittsthemen, die in 
den vier exemplarischen Domänen relevant sind aber auch darüber hinaus. Zu 
diesen Querschnittsthemen werden jeweils Empfehlungen formuliert. 
KI-Textgeneratoren werden in der Stellungnahme zwar mitbehandelt, sie ste- 
hen aber nicht allein und auch nicht zentral im Fokus.® Dennoch lassen sich gerade 


5 Vgl. Deutscher Ethikrat 2023, 63: „Der Deutsche Ethikrat geht von einem normativ grundlegenden 
Unterschied zwischen Mensch und Maschine aus. Softwaresysteme verfügen weder über theoreti- 
sche noch über praktische Vernunft. Sie handeln oder entscheiden nicht selbst und können keine 
Verantwortung übernehmen. Sie sind kein personales Gegenüber, auch dann nicht, wenn sie An- 
teilnahme, Kooperationsbereitschaft oder Einsichtsfähigkeit simulieren.“ 

6 Ebd., 64. 

7 Vgl. ebd., 16-17. 

8 Bei der Besprechung des schulischen Bildungsbereichs etwa wird deutlich, dass KI-Textgenera- 
toren nicht als wichtigste KI-Technologie im Bereich dieser Domäne angesehen werden: Ebd., 39: 
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von den Empfehlungen zu den Querschnittsthemen einige auch auf die spezifi- 
scheren Herausforderungen generativer KI anwenden, insbesondere zu den The- 
men 1: Erweiterung und Verminderung von Handlungsmöglichkeiten, 2: Wissens- 
erzeugung durch KI und Umgang mit KI-gestützten Voraussagen, 4: Auswirkungen 
von Klaufmenschliche Kompetenzen und Fertigkeiten, 9: Bias und Diskriminierung 
und 10: Transparenz und Nachvollziehbarkeit — Kontrolle und Verantwortung. 

Das erste Querschnittsthema greift noch einmal das zentrale Kriterium der 
Erweiterung von Handlungsmöglichkeiten auf. Dazu wird vom Ethikrat eine kon- 
textspezifisch differenzierte Planung des Einsatzes von KI-Werkzeugen empfohlen, 
da Vor- und Nachteile sowie die Gefahren eines Kompetenzverlusts durch die 
Nutzung von KI-Anwendungen für Personengruppen und Individuen je nach Do- 
mäne und Szenario variieren. Dabei sind insbesondere Zielsetzungen und Verant- 
wortlichkeiten präzise zu benennen und die Auswirkungen der Nutzung zeitnah zu 
evaluieren.” 

Hinsichtlich der Erzeugung von Wissen und Voraussagen durch KI-Tools betont 
der Ethikrat die Bedeutung klarer Verantwortlichkeit sowie effektiver Kontrollop- 
tionen. Es wird empfohlen KI als Hilfsmittel der Entscheidungsunterstützung und 
nicht als Mittel der Entscheidungsersetzung zu gestalten.'" 

Um individuelle oder kollektive Kompetenzverluste durch den Einsatz von KI- 
Anwendungen zu vermeiden, mahnt der Ethikrat zunächst eine sorgfältige Beob- 
achtung an. Unerwünschte Kompetenzverluste sollen minimiert oder kompensiert 
werden, wobei auch die Gefahr benannt wird, sich als Individuum oder Gesellschaft 
von Technologien abhängig zu machen, die ausfallen können.” 

Zur Vermeidung von Bias und Diskriminierung sollen KI-Systeme durch gut 
ausgestattete Institutionen beaufsichtigt und kontrolliert werden. Diese sollen auch 
gesetzliche Anforderungen zu Fairness, Transparenz und Nachvollziehbarkeit si- 
cherstellen. Allerdings wird zugleich betont, dass technischen und regulatorischen 
Maßnahmen zur Minimierung von Diskriminierung inhärente Grenzen gesetzt sind 
(etwa weil unterschiedliche Fairness-Ziele technisch nicht zugleich zu erfüllen sind) 
und dass daher Verfahren und Institutionen für ethische und politische Entschei- 


„Ausgangspunkt der meisten KI-Anwendungen in der Bildung ist die Sammlung und Auswertung 
vieler Daten der Lernenden und mitunter auch der Lehrkräfte.“ Dies zeigt die Gediegenheit der 
Stellungnahme des Ethikrats und den weiten Blick auf die generelle Entwicklung im Bereich 
Künstlicher Intelligenz — und dass der Hype der zahlreichen Debatten zu generativer KI andere 
Entwicklungen vielleicht sogar überdeckt. 

9 Vgl. ebd., 66. 

10 Vgl. ebd., 67. 

11 Vgl. ebd., 69. 
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dungen bezüglich kontextspezifischer Gerechtigkeitskriterien zu befördern sind. 
Diese sollten besonders betroffene sowie besonders bedürftige Gruppen schützen.” 

Transparenz, Nachvollziehbarkeit und Erklärbarkeit von KI-Systemen dienen 
deren Kontrolle und der Möglichkeit von Verantwortungszuschreibung. Um dies 
gewährleisten zu können, sollen aufgaben-, kontext- und adressatenspezifische 
Standards entwickelt und durch verbindliche technische und organisatorische 
Vorgaben umgesetzt werden. Mit diesen Standards werden die Anforderungen an 
Sicherheit, Datenschutz, Schutz von intellektuellem Eigentum und Geschäftsge- 
heimnissen sowie vor Missbrauch definiert." 


3.2 Büro für Technikfolgenabschätzung am Bundestag (TAB) 


Steffen Albrecht hat für das TAB ein sehr aufwändig recherchiertes Hintergrund- 
papier zu ChatGPT und vergleichbaren KI-Tools verfasst.'* Darin geht er in einem 
eigenen Kapitel auf die Auswirkungen von ChatGPT auf Bildung und Forschung ein. 
Für den Bildungsbereich analysiert Albrecht die Chancen und Risiken von ChatGPT 
entsprechend der unterschiedlichen Stakeholder - also Lernende, Lehrende und 
Institutionen. Für die Gruppe der Lernenden wird etwa konzediert, dass diese die 
neuen Möglichkeiten sehr wohlwollend aufgenommen haben und sie als Werk- 
zeuge der Texterstellung und -bearbeitung sowie zur Unterstützung des Selbstler- 
nen einsetzen. Ob durch eine umfangreiche Nutzung Lernprozesse eingeschränkt 
und die Kompetenzentwicklung beeinträchtigt werden (z.B. beim schriftlichen 
Ausdrucksvermögen oder der Informationssuche und -bewertung) zweifelt Al- 
brecht an bzw. sieht er hierzu ggf. wirksame didaktische Gegenmittel.’® 

Auch für Lehrende werden zahlreiche Potentiale diskutiert wie z.B. die Er- 
leichterung alltäglicher Kommunikationsaufgaben, die Planung von Unterricht bzw. 
Lehrveranstaltungen, die Schulung von Medienkompetenzen oder die leichtere 
Binnendifferenzierung von Lernstoff. Dass durch die Nutzung von ChatGPT aller- 
dings neue Kompetenzen vermittelt werden müssen, wird ebenso als zusätzliche 
Herausforderung gesehen wie die Möglichkeit, dass durch KI-Tools einer Verstär- 
kung soziokultureller Ungleichheit bezüglich der Teilhabe an der digitalen Gesell- 


12 Vgl. ebd., 74-75. 

13 Vgl. ebd., 76. 

14 Steffen Albrecht, „ChatGPT und andere Computermodelle zur Sprachverarbeitung - Grundla- 
gen, Anwendungspotenziale und mögliche Auswirkungen“, 2023, in [www.bundestag.de/resource/ 
blob/944148/30b0896f6e49908155fcd01d77f57922/20-18-109-Hintergrundpapier-data.pdf ] (Zugriff: 
30.09.2023). 

15 Für die Ausführungen zur Perspektive der Lernenden vgl. ebd., 72-73. 
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schaft Vorschub geleistet wird. Gesondert diskutiert werden noch einmal die Aus- 
wirkungen auf das Prüfungswesen, hier insbesondere auf den tertiären Sektor, wo 
die Distanz zwischen Lehrenden und Lernenden zumeist so groß ist, dass eine 
Einordnung schriftlicher Leistungen in die generelle Entwicklung des Kompetenz- 
aufbaus von Studierenden nur in Ausnahmefällen möglich ist. Eine Überprüfung 
auf die Erzeugung von Texten durch KI-Textgeneratoren mittels KI-Systemen wird 
aus Gründen der Effektivität und des Datenschutzes kritisch gesehen, ebenso ein 
Verbot von ChatGPT als unerlaubtes Hilfsmittel, da es sehr aufwändig sei, Formate 
oder Prüfungsumgebungen zu schaffen, in denen eine Nutzung ausgeschlossen ist. 
Stattdessen verweist Albrecht auf organisatorische und didaktische Lösungsansätze 
wie Protokollierung des Arbeitsprozesses oder ergänzende Prüfungsgespräche als 
Teil der Prüfungsleistung.'® 

Für die Institutionen des Bildungssystems werden mögliche Vorteile wiederum 
darin gesehen, dass KI-Systeme Entlastung bei Verwaltungsaufgaben bringen kön- 
nen — etwa bei der Studienberatung, der Bereitstellung von Informationen zum 
Campusleben oder der Erstellung von Kursbeschreibungen. Darüber hinaus ver- 
weist Albrecht auf Diskussionsbeiträge, welche in ChatGPT die Chance zur Hinter- 
fragung bestehender Bildungspraktiken und die Entwicklung neuer Kursformate 
und Prüfungsformen sehen. Als aktuell größte Herausforderung wird betont, dass 
eine datenschutzkonforme Anwendung im Rahmen von Unterricht und Lehre nicht 
möglich erscheint, sofern die Eingabe persönlicher Daten für die Nutzung erfor- 
derlich ist.” 

Zuletzt werden in dem Hintergrundpapier noch mögliche Auswirkungen auf 
die Forschung zusammengestellt. Als Vorteil wird auch hier wieder die Entlastung 
von Routineaufgaben gesehen, die eine Konzentration auf das eigentliche For- 
schungshandeln erlauben und damit eine Beschleunigung der Forschung bewirken 
könnte."® Die Erleichterung beim Erstellen von Übersetzungen könnte Forschenden 
helfen, trotz im Vergleich eingeschränkter Kompetenzen in der Nutzung der eng- 
lischen Sprache in internationalen Zeitschriften zu publizieren. Und nicht zuletzt 
können KI-Textgeneratoren einerseits selbst beforscht werden und auch als Mittel 
der Forschung Verwendung finden - etwa bei der Auswertung oder Interpretation 
von Daten. Den möglichen Vorteilen werden Risiken bzw. Probleme gegenüberge- 
stellt. Diese betreffen zunächst Ungenauigkeiten und den möglichen Bias der Mo- 
delle und deren z.T. fabulierten bzw. halluzinierten Outputs. Damit hängt auch die 


16 Für die Ausführungen zur Perspektive der Lehrenden vgl. ebd., 74-77. 

17 Für die Ausführungen zur Institutionenperspektive vgl. ebd., 78-79. 

18 Als Routineaufgaben werden das Verfassen verhältnismäßig standardisierter Abschnitte in 
Publikationen, Berichten oder Anträgen genannt - wie etwa die Darstellung der genutzten Me- 
thoden oder des Forschungsstandes. 
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fehlende Zuordnung von Informationen zu Quellen und generell eine fehlende 
Faktenorientierung von KI-Modellen zusammen. Weil im akademischen System ein 
hoher Publikationsdruck herrscht, steht zu befürchten, dass durch KI-Textgenera- 
toren die Menge an Publikationen rasant ansteigt, ohne dass eine sorgfältige Prü- 
fung möglich ist.'? 


3.3 Präsidium der Deutschen Forschungsgemeinschaft 


Im September 2023 hat das Präsidium der DFG eine dreiseitige Stellungnahme zum 
Einfluss generativer Modelle auf die Wissenschaften veröffentlicht darin auch 
Konsequenzen auf das eigene Förderhandeln reflektiert.” Darin wird zunächst 
betont, dass wissenschaftliches Arbeiten aufgrund der erheblichen Chancen und 
Entwicklungspotenziale von generativen Modellen wie z.B. KI-Textgeneratoren 
deren Einsatz nicht ausschließen sollte. Darauf aufbauend wird die Notwendigkeit 
verbindlicher Rahmenbedingungen artikuliert, die in der Form von sechs zentralen 
Gedanken knapp umrissen werden. Diese zielen im Wesentlichen auf die funda- 
mentale Bedeutung von Transparenz und Nachvollziehbarkeit zur Sicherung guter 
wissenschaftlicher Praxis sowie die Qualität wissenschaftlicher Ergebnisse ab: 


Der Einsatz generativer Modelle kann sich auf die Bedeutung, die der Erstellung eines Textes 
zukommt, sowie auf die Visualisierung von Forschungsergebnissen im wissenschaftlichen 
Alltag unterschiedlich weitreichend auswirken. Da es für Dritte nicht unmittelbar erkennbar 
ist, ob die ihnen vorliegenden Texte und Abbildungen mithilfe generativer Modelle erstellt oder 
die jeweils zugrunde liegenden wissenschaftlichen Ideen mithilfe generativer Modelle entwi- 
ckelt wurden, wird der transparente Umgang mit der Erzeugung von Text- und Bildinhalten ein 
wichtiger Aspekt bei der Bewertung dieser Technologien in Bezug auf die Sicherung wissen- 
schaftlicher Qualität sein.” 


Als Selbstverwaltungsorganisation der Wissenschaft in Deutschland und als zen- 
traler Fördergeber nimmt die DFG zwei Perspektiven auf die Herausforderung 
durch generative KI-Modelle ein. In Bezug auf das Selbstverständnis und das Ethos 
der Wissenschaft wird vom DFG-Präsidium die Bedeutung von Integrität als zen- 
tralem Baustein des wissenschaftlichen Wertesystems hervorgehoben. Daraus 


19 Für die Ausführungen zum Bereich der Forschung vgl. Albrecht 2023, 79-81. 

20 DFG, „Stellungnahme des Präsidiums der Deutschen Forschungsgemeinschaft (DFG) zum Ein- 
fluss generativer Modelle für die Text- und Bilderstellung auf die Wissenschaften und das Förder- 
handeln der DFG“, 2023, in [www.dfg.de/download/pdf/dfg_im_profil/geschaeftsstelle/publikationen/ 
stellungnahmen_papiere/2023/230921_stellungnahme_praesidium_ki_ai.pdf] (Zugriff: 30.09.2023). 
21 Ebd., 1-2. 
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werden mehrere Folgerungen abgeleitet: Zunächst, dass es für den Bereich der 
Wissenschaft geboten ist, anzugeben, ob und wie generative Modelle genutzt wer- 
den. Sodann, dass bei der Publikation wissenschaftlicher Ergebnisse sicherzustellen 
ist, dass kein geistiges Eigentum verletzt und dass kein wissenschaftliches Fehl- 
verhalten, etwa durch Plagiate, erzeugt wird. 

Neben der Innenperspektive auf die Wissenschaft wird in der Stellungnahme 
auch das Themenfeld der Antragsstellung adressiert. Hier sieht das DFG-Präsidium 
aktuell keine Gründe für eine normative Bewertung des Einsatzes von generativen 
Modellen bei der Antragsstellung - diese seien vielmehr „grundsätzlich weder po- 
sitiv noch negativ zu bewerten“.”” Bei der Erstellung von Gutachten allerdings wird 
der Einsatz der Modelle als unzulässig erklärt, weil durch diese eine Vertraulichkeit 
des Begutachtungsverfahrens nicht gewährleistet ist. 

Insgesamt ist die Stellungnahme des DFG-Präsidiums nicht mehr als ein erster 
Fingerzeig. Das passt aber auch zu der vertretenen Ansicht, dass die Entwicklung 
generativer KI-Modelle noch in den Kinderschuhen steckt und es daher einer 
fortlaufend „begleitenden Analyse und Bewertung bedarf, um die entsprechenden 
Chancen und möglichen Risiken abzuschätzen“.’” Dafür gibt es bei der DFG u.a. die 
Ad-hoc-AG des Senats zu Themen des Digitalen Wandels”* und die DFG-Kommission 
zur Überarbeitung der Verfahrensordnung zum Umgang mit wissenschaftlichem 
Fehlverhalten, sodass zum Ende des Papiers weitere Stellungnahmen durch die DFG 
in Aussicht gestellt werden. 

In den verschiedenen Einrichtungen der Hochschuldidaktik werden sehr um- 
triebige Diskussionen über die Chancen und Risiken der Nutzung von Sprachge- 
neratoren in Lehr- und Lernszenarien an Hochschulen geführt. Als Auswahl dazu 
werden im Folgenden die Vorschläge für Eigenständigkeitserklärungen der Deut- 
schen Gesellschaft für Hochschuldidaktik und dann die Initiativen der Hochschul- 
didaktischen Arbeitsstelle und des Digital Literacy Lab an der TU Darmstadt vor- 
gestellt. 


3.4 Deutsche Gesellschaft für Hochschuldidaktik 


Die Deutsche Gesellschaft für Hochschuldidaktik (dghd) hat neben einer Themen- 
reihe zu Kl in der Hochschullehre auch Vorschläge für Eigenständigkeitserklärun- 


22 Ebd, 2. 

23 Ebd, 1. 

24 Deutsche Forschungsgemeinschaft, „Ad-hoc-AG des Senats zu Themen des Digitalen Wandels“, 
2023, in [www.dfg.de/dfg_profil/jgremien/senat/digitaler_wandel/index.html] (Zugriff: 30.09.2023). 
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gen bei möglicher Nutzung von KI-Tools verfasst.” Darin wird betont, dass eine 
generelle Festlegung über die Erlaubnis oder das Verbot der Nutzung von KI-Text- 
generatoren in Prüfungsordnungen nicht sinnvoll ist, weil Prüfungsformen und 
Eigenständigkeitserklärungen dem jeweiligen Lernziel angepasst sein sollten. In 
dem Dokument werden vier verschiedene Lernziele diskutiert, die durch die 
Möglichkeiten von KI-Textgeneratoren entweder tangiert oder durch diese über- 
haupt erst ermöglicht werden: (1) Das Erwerben von Fachkompetenz, (2) das Er- 
lernen des wissenschaftlichen Schreibens, (3) die Kompetenz, KI-Tools einschätzen 
und wissenschaftlich bewerten zu können und schließlich (4) die professionelle 
Nutzung dieser Tools beim wissenschaftlichen Arbeiten. Es werden darüber hinaus 
weitere mögliche Lernziele im Zusammenhang mit generativer KI genannt, aber 
nicht weiter vertieft (und zwar das Programmieren und das Gestalten mithilfe von 
KI). Für die beiden erstgenannten Lernziele empfiehlt die dghd KI-Tools zunächst 
nicht zu erlauben und in die Eigenständigkeitserklärungen für entsprechende 
Prüfungsleistungen einen Passus aufzunehmen, der feststellt, dass keine Outputs 
von text-, bild- oder codegenerierenden KI-Tools in der Ausarbeitung verwendet 
wurden. Hinsichtlich der Fachkompetenz lautet das Argument, dass Studierende 
sich Fachwissen selbst aneignen und dieses auch nachhaltig in ihr wissenschaftli- 
ches Verständnis integrieren müssen. Da die stochastisch erzeugten Outputs von 
Textgeneratoren erstens der Anforderung an Wissen nicht genügen (ihre wissen- 
schaftliche Qualität also nicht gesichert ist) und weil Studierende sich zudem erst 
selbst eine Basis fachwissenschaftlicher Kenntnisse erarbeiten müssen, um hallu- 
zinierte von validen Aussagen unterscheiden zu können, wird die Nutzung von KI- 
Tools für den Aufbau grundlegender Fachkompetenz abgelehnt.” Auch mit Blick 
auf das Lernziel, selbst wissenschaftlich schreiben zu können, sollte nach der dghd 
der Einsatz von Textgeneratoren zunächst nicht erlaubt werden. Denn die Fähig- 
keit, im eigenständigen Formulieren die Gedanken von anderen zu verstehen und 
mithilfe eigener Gedanken weiterzuentwickeln und diese Ergebnisse zu kommu- 
nizieren, lässt sich nur durch eigenes Tun und Üben erwerben.” Hinsichtlich der 
Identifikation von und des Umgangs mit Verstößen gegen das Verbot der KI-Nut- 
zung wird das Problem benannt, dass Zuwiderhandlungen kaum nachweisbar sind. 
Daher verbleibt als Lösungsansatz, zu Beginn von Lehrveranstaltungen die Be- 
deutung eigenständiger Lernleistungen zu betonen und anzukündigen, dass in 


25 Deutsche Gesellschaft für Hochschuldidaktik, „Vorschläge für Eigenständigkeitserklärungen bei 
möglicher Nutzung von KI-Tools“, 2023, in [https://www.dghd.de/die-dghd/downloads/] (Zugriff: 30.09. 
2023); dghd-Themenreihe KI in der Hochschullehre, 2023, in [www.dghd.de/praxis/veranstaltungska 
lender/dghd-themenreihe-ki-in-der-hochschullehre/] (Zugriff: 30.09.2023). 

26 Vgl. ebd., 6. 

27 Vgl. ebd., 7. 
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Fällen, in denen ein Verdacht besteht, dass die Eigenständigkeit der Leistung 
fälschlich und mit Täuschungsabsicht erklärt wird, mündliche Gespräche zu führen 
sind, in denen die Fach- oder Schreibkompetenz jeweils überprüft wird.” 

Neben diesen etablierten Feldern der wissenschaftlichen Ausbildung kann es 
auch als Aufgabe der Hochschulen verstanden werden, Studierende im Umgang mit 
KI-Tools zu schulen. Für den Aufbau von Kompetenzen mit Hilfsmitteln wie Text- 
generatoren müssen Studierende diese logischerweise nutzen. Dabei kann es zum 
einen um die qualifizierte Bewertung dieser Hilfsmittel gehen (Lernziel 3): Wie 
schneiden sie im Vergleich mit anderen, in der Wissenschaft etablierten Methoden 
ab, wie etwa der Literaturrecherche oder der Nutzung von Fachdatenbanken? 
Studierende sollten hier aus didaktischer Perspektive zumindest drei Schritte do- 
kumentieren. (1) Welche Tools sie wie genutzt haben. (2) Die Outputs des oder der 
Tools. (3) Eine Reflexion über die Ergebnisse im Vergleich mit anderen Methoden. 
Dieser Dreischritt zeigt, dass Studierende schon mit anderen Methoden vertraut 
sein müssen, da sie sonst keinen Vergleich anstellen und keine Bewertung vor- 
nehmen können. Außerdem wird deutlich, dass der Aufwand der Dokumentation 
wiederum beträchtlich sein kann — sowohl das Erstellen der Dokumentation als 
auch deren Prüfung und Bewertung aufseiten der Lehrenden. Der vorgeschlagene 
Passus für die Eigenständigkeitserklärung zielt folgerichtig auch auf eine vollstän- 
dige Dokumentation der ersten beiden Schritte.” 

Als letztes Lernziel wird von der dghd die professionelle Nutzung von KI-Tools 
aufgezählt, wenn diese etwa zum Verfassen von wissenschaftlichen Qualifikati- 
onsschriften wie Master- oder Doktorarbeiten genutzt werden. Wo hier Grenzen für 
den Einsatz von Textgeneratoren und anderen Hilfsmitteln gesetzt werden, bleibt 


28 Wie scharf oder stumpf dieses Schwert ist, lässt sich nur von Fall zu Fall beurteilen und hängt an 
den Kriterien, die Lehrende hinsichtlich der Lernziele und des Kompetenzaufbaus anlegen. Je- 
denfalls wird durch zusätzliche mündliche Gespräche der Begründungs- und der Zeitaufwand in 
beträchtlichen Maß ausgeweitet. Besser als Täuschungen retrospektiv aufdecken zu wollen, ist vor 
diesem Hintergrund also der Ansatz, prospektiv die Bedeutung eigenständiger Leistungen für den 
Aufbau wissenschaftlicher Kompetenzen zu betonen und zu begründen. 

29 Der Vorschlag lautet: „Ich habe nur die erlaubten und dokumentierten Hilfsmittel benutzt. Ich 
versichere, dass die Kennzeichnung des KI-Einsatzes vollständig ist. Im Verzeichnis ‚Übersicht 
verwendeter Hilfsmittel‘ habe ich die verwendeten KI-Tools mit ihrem Produktnamen aufgeführt. 
Im Anhang habe ich *die von mir verwendeten Prompts aufgeführt, [oder] *sämtliche KI-gene- 
rierten Outputs einzeln aufgeführt [z.B. Links auf Promptverläufe], [oder] *die Nutzung der KI-Tools 
dokumentiert [...], die relevant für die Aufgabe waren.“, ebd., 10. Vonseiten der Lehrenden sollte 
zudem im Vorfeld geklärt werden, welche Hilfsmittel erlaubt sind. Neben der Erlaubnis zur Nutzung 
aller möglichen Hilfsmittel kann hier eine Auswahl getroffen und kommuniziert werden, wobei 
dann zugleich gilt, dass alle anderen Tools nicht erlaubt sind. Eine Auswahl verbotener Tools ist 
wenig zielführend, weil das Angebot an Hilfsmitteln nicht zu überblicken ist. 
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allerdings unklar. Ausgegangen wird von einem Szenario, in dem Studierende 
grundlegende Fach-, Schreib- und Toolkompetenzen schon erlangt haben und diese 
dann zusammenführen. Diese Aggregation ist es dann auch, was als Gegenstand der 
Prüfung vorgeschlagen wird: „Bewertet wird die Arbeit als Ergebnis des Einsatzes 
unterschiedlicher Methoden und eigenständigen Denkens.“*° Dies spiegelt sich auch 
im Vorschlag für eine Eigenständigkeitserklärung nieder, in der die studentische 
Verantwortung für die KI-generierten Outputs das zentrale Element ist, flankiert 
von der schon diskutierten Dokumentation: 


Ich habe nur die erlaubten und dokumentierten Hilfsmittel benutzt. Ich verantworte die 
Auswahl, Übernahme und sämtliche Ergebnisse des von mir verwendeten KI-generierten 
Outputs vollumfänglich selbst. Im Verzeichnis ‚Übersicht verwendeter Hilfsmittel‘ habe ich alle 
verwendeten KI-Tools mit ihrem Produktnamen benannt [und je nach Bedarf des/der Leh- 
renden] sowie im Anhang jeweils die *von mir in der Arbeit verwendeten Prompts aufgeführt 
[und/oder] *sämtliche in der Arbeit verwendeten KI-generierten Outputs einzeln aufgeführt 
[z.B. Links auf Promptverlaufe].** 


An dieser Konzeption zur Integration von KI-Tools in die wissenschaftliche Praxis 
erscheint es bezüglich Qualifikationsschriften problematisch, eine angemessene 
Form der Dokumentation zu finden. Positiv ist zu bewerten, dass Lehrende und 
Studierende je nach Disziplin und Qualifikationslevel von Fall zu Fall individuelle 
Absprachen treffen können - denn ein einheitlicher Maßstab würde die unter- 
schiedlichen Anforderungen der akademischen Fächer kaum berücksichtigen 
können. Aber zwischen dem kaum informativen Benennen der genutzten Tools 
einerseits und der umfassenden Dokumentation der Prompts oder gar Outputs 
andererseits klafft eine Lücke für die Praxis der Bewertung. Wo im ersten Fall die 
Eigenständigkeit kaum mehr zu bewerten ist, als wenn die Information fehlte, so ist 
im zweiten Fall zwar unter günstigen Umständen eine objektive Faktenlage Teil der 
Bewertung — was allerdings den Prüfungsaufwand erheblich steigern könnte. Und 
es ist dabei sehr fraglich, ob sich diese Verschiebung mit den wissenschaftlichen 
Qualifikationszielen begründen lässt. Demnach scheint hinsichtlich von größeren 
schriftlichen Leistungsnachweisen und Qualifikationsarbeiten noch keine Lösung 
für einen integrativen Umgang mit KI-Textgeneratoren gefunden. 


30 Ebd., 13. 
31 Ebd. 14. 
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3.5 Hochschuldidaktische Arbeitsstelle 


Einzelne Universitäten haben verschiedentlich Kompetenzzentren ins Leben geru- 
fen oder sich innerhalb bestehender Strukturen mit der Herausforderung durch KI- 
Textgeneratoren beschäftigt.”” An der TU Darmstadt gibt es dazu z.B. zumindest 
zwei sichtbare Akteure, die sich um Aufklärung und um Formen von Community- 
Building bemühen. Dabei handelt es sich um die Hochschuldidaktische Arbeitsstelle 
und das Digital Literacy Lab. 

Die Hochschuldidaktische Arbeitsstelle (HDA) hat zwei Themen neu in die 
Themensammlung ihres Angebots zur Unterstützung guter Hochschullehre aufge- 
nommen, die beide durch die Veröffentlichung von ChatGPT motiviert sind. Der 
Artikel „Künstliche Intelligenz in der Hochschullehre am Beispiel von ChatGPT“*® 
stellt ausführlich dar, wie textbasierte KI gegenwärtig funktioniert und welche 
Konsequenzen sich für das wissenschaftliche Arbeiten, für den Aufbau wissen- 
schaftlicher Kompetenzen (hier insbesondere die Kompetenz des Schreibens) und 
für das Prüfungswesen an Hochschulen ergeben können. In seinem tentativen Zu- 
gang lotet dieser Beitrag mögliche Wege im Umgang mit Textgeneratoren in der 
Hochschulehre aus und stellt diese ohne stärkere Wertungen vor. Anders gelagert ist 
hier der Artikel „Einsatzmöglichkeiten textbasierter KI in der Hochschullehre“**: 
Dieser verfolgt einen pragmatischen Ansatz und zeigt einzelne Felder auf, in denen 
KI-Textgeneratoren Studierenden und Lehrenden nützen können. Genannt werden 
dafür in allgemeiner Hinsicht die Unterstützung bei der Textproduktion und dem 
Programmieren, spezifisch für Studierende die Unterstützung und Individualisie- 
rung des Lernens und bezogen auf Lehrende die Vorbereitung und Organisation der 
Lehre sowie das Erstellen von Lern- und Prüfungsaufgaben. In Kombination stellen 


32 Im Folgenden gehe ich auf zwei Initiativen an meiner Hochschule, der Technischen Universität 
Darmstadt, ein. Es gibt daneben aber zahlreiche weitere. Exemplarisch genannt seien: Stabsstelle IT- 
Recht der bayerischen staatlichen Universitäten und Hochschulen, „Prüfungsrechtliche Fragen zu 
ChatGPT“, 2023, in [wwwrz.uni-wuerzburg.de/fileadmin/42010000/it-recht/ChatGPT_Pru_fungs 
recht_v2.pdf] (Zugriff: 30.09.2023); Berliner Zentrum für Hochschullehre, „Mit künstlicher Intelli- 
genz die Hochschullehre neu gestalten“, 2023, in [www.tu.berlin/bzhl/ressourcen-fuer-ihre-lehre/res 
sourcen-nach-themenbereichen/ki-in-der-hochschullehre] (Zugriff: 30.09.2023); Schreiblabor der 
Universität Bielefeld, „Digitale Technologien zur Textgenerierung und das Schreiben in Studium und 
Lehre“, 2023, in [wwwuni-bielefeld.de/einrichtungen/schreiblabor/chat-gpt/] (Zugriff: 30.09.2023). 
33 Technische Universität Darmstadt. Infoportal einfachlehren, „Künstliche Intelligenz in der 
Hochschullehre am Beispiel von ChatGPT“, in [wwweinfachlehren.tu-darmstadt.de/themensamm 
lung/details_48064.de.jsp] (Zugriff: 30.09.2023) 

34 Technische Universität Darmstadt. Infoportal einfachlehren, „Einsatzmöglichkeiten textbasier- 
ter KI in der Hochschullehre“, in [wwweinfachlehren.tu-darmstadt.de/themensammlung/details_ 
48128.de.jsp] (Zugriff: 30.09.2023) 
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die beiden Artikel recht anschaulich die beiden Wege dar, mit denen Lehrende und 
Hochschulen auf die Herausforderungen durch KI-Textgeneratoren reagieren. Ver- 
suche der verstehenden Einordnung und Uberblicksdarstellungen stehen jenen 
gegenüber, welche die faktisch gegebenen Möglichkeiten proaktiv aufgreifen und in 
die gegebene Praxis zu integrieren versuchen. 


3.6 Digital Literacy Lab 


Das Digital Literacy Lab (DLL) ist ein Forum am Fachbereich Gesellschafts- und 
Geschichtswissenschaften und Teil des LeNA-QSL-Projekts „Kompetenznetzwerk 
Digitalität in der Lehre“, das Räume für den fachlichen Austausch bereitstellt und 
Informationsangebote für Lehrende sowie Studierende der Geistes- und Sozial- 
wissenschaften entwickelt. Im Rahmen eines organisierten Austauschs und einer 
Reihe an Workshops können Lehrende am Fachbereich eine abgestimmte Position 
zum Umgang mit generativen Sprachmodellen in Forschung und Lehre entwickeln 
und offene Punkte zur Diskussion stellen.” Zu den ersten Erträgen der Diskussion 
gehört (1) die Einsicht, dass eine Einigung über eine einheitliche Regelung für den 
Einsatz von ChatGPT zwischen allen Lehrenden kaum zu erzielen ist, (2) dass der 
Umgang mit KI-Textgeneratoren sich aus dem Konnex von Forschung und Lehre 
ergibt - so dass ein Einsatz in der Lehre ggf. durch einen Einsatz in der Forschung 
zu rechtfertigen ist, (3) dass der kompetente Umgang mit KI-Tools (aktuell) kein 
zentrales Lehrziel ist, aber Zeit erfordert, die für andere Inhalte dann nicht mehr 
zur Verfügung steht und (4) dass durch die Möglichkeiten generativer KI-Anwen- 
dungen Prüfungen prozess- statt produktorientiert gestaltet werden müssen - und 
entsprechend dem didaktischen Prinzip des Constructive Alignment auch die Lehre 
an prozessorientiertes Prüfen anzupassen ist. 

In den Materialien, die über die flankierende Diskussion hinaus bereitgestellt 
werden, zeigt sich wiederum der zweigleisige Ansatz, einerseits grundlegende In- 
formationen bereitzustellen und über die Funktionsweise von KI-Textgeneratoren 
aufzuklären und andererseits proaktiv neue Praxisformen zu testen und die neuen 
Möglichkeiten konstruktiv einzubinden. 


35 Das Digital Literacy Lab ist über einen Moodle-Kurs organisiert: in [https://moodle.tu-darmstadt. 
de/course/view.php?id=31716] (Zugriff: 30.09.2023). 
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3.7 Rechtsgutachten zum Umgang mit KI-Software im 
Hochschulkontext 


Die in den letzten Abschnitten aufgezeigten Fragen zur Reziprozität didaktischer 
und rechtlicher Perspektiven auf KI-Textgeneratoren in wissenschaftlichen 
Schreibprozessen werden auch in einer Veröffentlichung des Zentrums für Wis- 
senschaftsdidaktik der Ruhr-Universität Bochum adressiert, die neben einer Ein- 
führung in KI-basierte Schreibwerkzeuge in der Hochschule auch das im deutschen 
Sprachraum erste Rechtsgutachten zum Umgang mit KI-Software im Hochschul- 
kontext enthält.” In Auftrag gegeben vom Ministerium für Kultur und Wissenschaft 
des Landes Nordrhein-Westfalen, wurde das Gutachten von Thomas Hoeren von der 
Universität Münster erarbeitet, der darin die zurzeit relevanten rechtlichen Rah- 
menbedingungen für den Einsatz von KI-Textgeneratoren im Hochschulbereich 
erörtert.” 

Im ersten Abschnitt wird dargelegt, dass nach dem Urheberrechtsgesetz eine 
persönliche geistige Schöpfung die Bedingung dafür ist, dass jemand Schöpfer:in 
eines Werkes ist. KI-Textgeneratoren können also allein keine Werke im Sinne des 
Urheberrechtsgesetz erzeugen. Bezüglich der Möglichkeit, dass Menschen unter 
Zuhilfenahme von KI-Tools urheberrechtlich relevante Werke erzeugen, ist eine 
Abwägung von Fall zu Fall vorzunehmen (und dabei in einer ersten Annäherung 
nicht grundlegend anders gelagert als bei der Nutzung schon länger etablierter 
Programme wie Photoshop). Entscheidend ist die geistige Eigenleistung beim Ver- 
fassen vom Prompts und beim Erzeugen von KI-generiertem Text - so dass eine 
Unterscheidung vorgenommen werden kann „zwischen KI-gestützten menschli- 
chen Schöpfungen und durch KI erzeugten Schépfungen“.** Mit Blick auf das Ur- 


36 Peter Salden/Jonas Leschke, „Didaktische und rechtliche Perspektiven auf KI-gestütztes Schrei- 
ben in der Hochschulbildung‘“, 2023 (DOI: 10.13154/294-9734). 

37 Thomas Hoeren, „Rechtsgutachten zum Umgang mit KI-Software im Hochschulkontext“, in Di- 
daktische und rechtliche Perspektiven auf KI-gestütztes Schreiben in der Hochschulbildung, hg. von 
Peter Salden/Jonas Leschke, 2023 (DOI: 10.13154/294-9734). Vgl. für eine weitere rechtliche Beurtei- 
lung: Thomas Wilmer, „Rechtsfragen bei ChatGPT & Co. Einsatz und Nutzung nach aktuellem und 
künftigem Recht“, Kommunikation & Recht, Bd. 26(4), 2023, 233-240. 

38 Hoeren 2023, 6. Er bezieht sich hier auf die Entschließung des Europäischen Parlaments vom 
20. Oktober 2020 zu den Rechten des geistigen Eigentums bei der Entwicklung von KlI-Technologien: 
in [www.europarl.europa.eu/doceo/document/TA-92020-0277_DE.html] (Zugriff: 30.09.2023). Für ei- 
ne Erläuterung des Unterschieds vgl. ebd., 25-26: „Moderne KI-Programme, wie beispielsweise 
ChatGPT, verlangen oft nur einen Arbeitsbefehl, einen sog. ‚prompt‘. Die restliche Arbeit leistet die 
KI allein. Wird der Text vom Menschen nicht mehr verändert, bleibt also nur der prompt als An- 
knüpfungspunkt für die menschliche schöpferische Leistung. Das wird regelmäßig nicht genügen, 
um einen Urheberrechtsschutz zu bejahen, da sich die wesentlichen gestalterischen Entscheidungen 
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heberrecht lässt sich aber nicht nur danach fragen, ob mit Textgeneratoren urhe- 
berrechtlich relevante Texte (oder andere Werke) erzeugt werden können, sondern 
auch, ob durch die Nutzung der Tools Urheberrechte verletzt werden. Das kann z.B. 
dann der Fall sein, wenn in den Trainingsdaten urheberrechtlich geschützte Werke 
(oder Werkteile) hinterlegt sind und diese unverändert oder nur leicht abgewandelt 
als Output ausgegeben werden. Wird dieser Output nun publiziert, kann eine Ur- 
heberrechtsverletzung vorliegen.” Da generative KI-Tools Texte allerdings Wort für 
Wort auf Basis von Wahrscheinlichkeiten generieren und keine Textbausteine in 
Gänze übernehmen, ist eine Urheberrechtsverletzung durch die (unbewusste) 
Übernahme ganzer Werkteile mehr als unwahrscheinlich.* 

Kennzeichnungspflichten sind das Thema im zweiten Abschnitt des Gutach- 
tens. Dabei stellt Hoeren heraus, dass der unmarkierte Einsatz von KI-Tools unter 
Umständen als Täuschungsversuch oder als wissenschaftliches Fehlverhalten zu 
werten ist. Diese Fälle werden im dritten Abschnitt, der dem wissenschaftlichen 
Fehlverhalten gewidmet ist, detailliert beschrieben. Hinsichtlich möglicher Kenn- 
zeichnungspflichten wird zuvor noch auf die mögliche Relevanz der Lizenz- oder 
Nutzungsbedingungen der jeweiligen KI-Tools hingewiesen. Insofern diese vor- 
schreiben, dass auf die Verwendung der Software hinzuweisen ist, sind Nutzende 
dazu verpflichtet, dieser Bedingung nachzukommen.” 

Während die Regeln guter wissenschaftlicher Praxis selbst keine verbindlichen 
rechtlichen Regelungen darstellen, erhalten sie einen rechtsverbindlichen Charak- 
ter, wenn sie durch Hochschulen in Prüfungsordnungen übernommen oder als 
Satzungen o.ä. umgesetzt werden. Eine unmarkierte Übernahme von Texten aus KI- 
Textgeneratoren kann als Plagiat verstanden werden, das als „die unbefugte Ver- 


aus den Berechnungen des KI-Programms ergeben. Erst, wenn entweder ein solch detaillierter 
prompt oder eine Verkettung stark steuernder prompts vorliegen, dass diese alle wesentlichen 
Gestaltungsentscheidungen vorgeben und das KI-Programm nur als ausführendes Instrument er- 
scheint, oder die Nutzer:in den generierten Text im Sinne eines Denkanstoßes weiter bearbeitet, 
kann von einem urheberrechtlich geschützten Werk ausgegangen werden. Die Grenze ist hier also 
fließend.“ 

39 Vgl. ebd., 28. 

40 Vgl. ebd. 

41 Vgl. ebd., 29. Dort finden sich auch Ausführungen dazu, welche Anforderungen an Kennzeich- 
nungen in verschiedenen Fällen zu stellen sind: „Wurden die Texte wortwörtlich übernommen, so 
empfiehlt es sich, die Stelle ähnlich wie ein ‚klassisches‘ Zitat zu behandeln. Wurde das KI-Pro- 
gramm hingegen als Inspirationsquelle oder Gedankenanstoß verwendet, könnte eine Hilfsmittel- 
angabe zu Beginn oder am Ende genügen. Eine Hilfsmittelangabe dürfte auch für den Fall genügen, 
dass der KI-generierte Text wortwörtlich übernommen wird, nachdem die Nutzer:in wie oben be- 
schrieben den prompt so formuliert hat, dass die KI keinen Zufallsspielraum mehr hat bzw. die 
Eingabe durch konkretisierende prompts der Nutzer:in soweit präzisiert wurden, das ein Urhe- 
berrecht für die Nutzer:in wieder angenommen werden kann“. 
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wertung [geistigen Eigentums] unter Anmaßung der Autorschaft“ definiert ist.“ 


Eine Anmaßung der Autorschaft liegt auch dann vor, wenn bei wissenschaftlichen 
Veröffentlichungen nicht nachvollziehbar angegeben ist, welche Inhalte eigene 
Gedanken sind und welche Teile anderen bzw. fremden Quellen entnommen sind. 
Demgegenüber liegt kein Verstoß gegen die Regeln guter wissenschaftlicher Praxis 
vor, wenn auf die Nutzung von KI-Tools hingewiesen und damit angezeigt wird, 
wenn ein Text nicht dem eigenen Wissen entstammt, sondern KI-generiert ist. Für 
Hoeren ist der markierte Einsatz von KI-Schreibwerkzeugen analog zur Verwen- 
dung von wörtlichen Zitaten zu behandeln.” 

Prüfungsrechtlich sind Hochschulen berechtigt, gemäß der Hochschulgesetze 
der Bundesländer von ihren Studierenden Versicherungen verlangen, in denen 
diese erklären, Prüfungsleistungen selbstständig und ohne unzulässige fremde 
Hilfe erbracht zu haben. Ein unmarkierter Einsatz von KI-Textgeneratoren könnte 
als Verstoß gegen diese Selbstständigkeitserklärung und somit als Täuschungsver- 
such gewertet werden. Wie bei der Frage der Urheberschaft ist hier allerdings 
abzuwägen, inwieweit eine eigenständige Leistung auch dann vorliegen kann, wenn 
KI-Tools zum Einsatz kommen. Ein etwas längeres Zitat aus dem Gutachten verweist 
auf das Spektrum von der absolut selbständigen studentischen Leistung bis hin zum 
reinen Kopieren: 


Werden ohne signifikante geistige Eigenleistung KI-generierte Erzeugnisse kopiert, welche für 
die Prüfungsleistung relevante Inhalte enthalten, wird ein selbstständiges Verfassen ohne 
fremde Hilfe wohl nicht vorliegen können, da keine Eigenständigkeit mehr gegeben ist. So 
bedeutet der Begriff der Eigenständigkeit in diesem Zusammenhang, dass die Ergebnisse auf 
eigener Grundlage fußen, also das für die Lösung der Prüfungsleistung erforderliche Wissen 
von den Studierenden stammen muss. Wenn dieses Wissen von der KI ‚generiert‘ wird, kann 
nicht mehr von einer selbständigen Leistung ausgegangen werden. 


[...] Soweit die Studierenden z.B. ChatGPT oder perspektivisch eine ‚Word-KI‘ verwenden und 
von ihr generiertes sowie formuliertes Wissen wortwörtlich übernehmen, ohne dies kenntlich 
zu machen und ohne signifikant die Textproduktion gesteuert zu haben, wird man einen 
Täuschungsversuch annehmen müssen. Dagegen kann die Verwendung zulässig sein, wenn sie 
lediglich ergänzende Formulierungsvorschläge macht, ohne den Studierenden die Lösung der 


42 Vgl. ebd., 31 sowie den dort zitierten Beschluss der Hochschulrektorenkonferenz von 1998 und 
die Verfahrensordnung der Max-Planck-Gesellschaft in der Fassung aus dem Jahr 2000. Hoch- 
schulrektorenkonferenz, „Empfehlung zum Umgang mit wissenschaftlichem Fehlverhalten in den 
Hochschulen“, 1998, in [wwwhrk.de/positionen/beschluss/detail/zum-umgang-mit-wissenschaftli 
chem-fehlverhalten-in-den-hochschulen] (Zugriff: 30.09.2023); Max-Planck-Gesellschaft, „Verfah- 
rensordnung bei Verdacht auf wissenschaftliches Fehlverhalten“, 2000, in [www.mpg.de/199559/ver 
fahrensordnung.pdf] (Zugriff: 30.09.2023). 

43 Vgl. Hoeren 2023, 32. 
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Prüfung abzunehmen. Auch die inspirierende Nutzung einer Kl als Gedankenanstoß wird noch 
als zulässig zu erachten sein.“ 


Die Rechtmäßigkeit einer Prüfung ist demnach an die selbständige studentische 
Leistung gebunden. Wie sich aber über die Annahme der Versicherung hinaus ganz 
praktisch überprüfen lässt, ob eine Leistung tatsächlich selbständig (ggf. auch mit 
den genannten Abstufungen) erbracht wurde, dazu gibt es in dem Gutachten keine 
Ausführungen. Die Notwendigkeit einer Eigenleistung gilt auch für die Bewertung 
von Prüfungsleistungen, so dass KI-generierte Bewertungen nicht zulässig sind.” 
Das Gutachten wägt hier aber auch wieder Abstufungen mit ab: Neben der voll- 
umfänglichen Bewertung durch eine KI und die Übernahme des Ergebnisses durch 
die für eine Prüfung verantwortliche Person werden zwei weitere Szenarien be- 
schrieben: In dem Fall, dass durch ein KI-Tool eine erste Eischätzung vorgeschlagen 
und auf dieser Basis die Bewertung vorgenommen und formuliert wird, fehlt 
wiederum die erforderliche Eigenleistung der prüfenden Person. Spielraum gibt es 
dagegen bloß dann, wenn KI-Tools nur als Ergänzung herangezogen werden.” 
Hierbei ist allerdings wiederum das Urheberrecht zu beachten, da Prüfungsleis- 
tungen in der Regel urheberrechtlich geschützt sind. Da ChatGPT potenziell alle 
Eingaben über die Anfrage hinaus als Trainingsdaten nutzen kann, lässt sich die 
Gefahr einer Urheberrechtsverletzung nicht ausschließen. Hoeren schätzt eine 
Nutzung vor diesem Hintergrund kritisch ein: „Solange die jeweilige Softwareher- 
steller:in nicht ausdrücklich Stellung hierzu bezieht, ist daher von einer solchen 
Verwendung zur Kontrolle der Prüfungsleistung abzuraten.“*’ 

Das Gutachten endet mit Überlegungen zu aktuellen Regelungsbedarfen. Hier 
wird die Anpassung der Eigenständigkeitserklärung empfohlen. Auch wenn es 
rechtlich nicht notwendig ist, weil das Kopieren von KI-generierten Textbausteinen 
nicht als selbständiges Verfassen gelten kann und somit schon durch bislang ge- 
nutzte Formulierungen ausgeschlossen wird, kann die Anpassung zu mehr Klarheit 


44 Ebd., 33. 

45 Vgl. ebd., 36: „Soweit die KI-Software dafür verwendet wird, dass die Prüfungsleistung im KI- 
Interface eingegeben, die Bewertung vollumfanglich der KI tiberlassen und das Ergebnis im 
Wortlaut übernommen wird, liegt keine zulässige Bewertung der Prüfungsleistung vor. In diesem 
Anwendungsfall wird die Bewertung gerade nicht von bzw. durch die prüfende Person vorgenom- 
men, sondern allein durch die KI-Software. Die Prüfungsordnungen bzw. Ausbildungsgesetze lassen 
hierfür keinen Spielraum übrig.“ 

46 Vgl. ebd., 37: „Sollte die KI-Software dagegen nur ergänzend verwendet werden, d.h. die prü- 
fende Person nimmt die Würdigung der Arbeit selbstständig vor und nutzt die KI-Software für eine 
zusätzliche Einschätzung, sodass das Erzeugnis der KI lediglich mittelbar einfließt, so sprechen die 
Prüfungsordnungen gegenwärtig nicht gegen den Einsatz der KI-Software.“ 

47 Ebd. 
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und Bewusstsein über die Verwendung generativer KI-Tools beitragen. Als zentrale 
Ebene für die Klärung und Regulierung des Einsatzes von KI-Textgeneratoren 
werden die Prüfungsordnungen ausgemacht, da hier detailliert und an die Studi- 
engänge angepasst die zulässigen (oder unzulässigen) Formen der Verwendung 
definiert werden kénnen.”* Hier kann ein einheitlicher Rahmen geschaffen werden, 
der als Orientierung für alle Beteiligten eines Studiengangs dient.” 


4 Diskussion der Normordnungen 


Die Zusammenschau der verschiedenen Normordnungen mit Relevanz für den 
Einsatz generativer Klin der Wissenschaft erlaubt einige synoptische Bemerkungen 
zum gegenwärtigen Diskurs. Da das Phänomen von KI-Textgeneratoren noch sehr 
neu ist, beginnen viele der vorgestellten Texte mit technischen und historischen 
Erläuterungen zu Künstlicher Intelligenz und Transformer-Modellen (Ethikrat, TAB, 
HDA und DLL). 

Die Stellungnahme des Ethikrats hebt sich von den anderen Ansatzen dadurch 
ab, dass explizit über das Vokabular der anthropologischen Grundbegriffe die 
Wertebasis zur Analyse von KI herausgestellt wird. Auf dieser Basis findet sich auch 
die klare Forderung, dass KI-Systeme der „Erweiterung menschlicher Handlungs- 
fähigkeit“ dienen sollen. Eine ähnlich klare Zielstellung findet sich in den anderen 
Texten nicht, diese verfahren deutlich tentativer. 

Auffällig ist, dass viele der Texte sich gegenseitig referenzieren. Zentral ist hier 
das Rechtgutachten von Hoeren, in geringerem Ausmaß werden auch Bezüge zu der 
Stellungnahme des Ethikrats und dem Hintergrundpapier des TAB hergestellt. In 
allen Beiträgen außer der Stellungnahme des DFG-Präsidiums wird auf (mitunter 
sehr) viele weitere Quellen verwiesen, die z.T. auch Online-Präsentationen und 
dergleichen beinhalten. Dies zeigt, dass einen enormen Austausch an Ideen, Sicht- 
weisen, Fragen und Problemstellungen gibt und dass Texte wie die der beratenden 
Gremien (Ethikrat, TAB) wichtig sind, um den Diskurs zu KI-Textgeneratoren zu 
strukturieren und zu bündeln. Das TAB-Hintergrundpapier ist in dieser Hinsicht 
wie ein Tableau der aktuell diskursiv virulenten Ansichten. 

Foren wie das exemplarisch vorgestellte Digital Litercy Lab oder die Themen- 
reihe der dghd erfüllen demgegenüber die Funktion, Fragen und Bedenken direkt 


48 Vgl. ebd., 40: Eine Notwendigkeit für die Anpassung der Hochschulgesetze wird demgegenüber 
nicht gesehen. Zum einen, weil die Prüfungsordnungen als hinreichende Formen der Regulierung 
ausgemacht werden. Und zum anderen, weil zu umfassende Verbote über landesweite Regelungen 
zu Konflikten mit der Lehr- und Wissenschaftsfreiheit führen könnten. 

49 Vgl. ebd., 39. 
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aus praktischen Kontexten heraus artikulieren zu können. Hinsichtlich der nor- 
mativen Ordnungen fungieren diese Beiträge als Sammelbecken und Andocksta- 
tionen, durch die eine aktive Mitgestaltung für viele Beteiligte ermöglicht wird. Ein 
einordnender Text wie das TAB-Hintergrundpapier basiert u.a. auf zahlreichen 
Debattenbeiträgen von Interessierten (mit oder ohne Expertise). 

Der Wert, auf den sich alle Normordnungen einigen, ist Transparenz. Vom 
Ethikrat über die DFG bis hin zur HDA und auch das Rechtsgutachten wird die 
Notwendigkeit eines transparenten Umgangs mit KI-Textgeneratoren in der Wis- 
senschaft (auch bei Prüfungen oder Qualifikationsschriften — Stichwort: Eigen- 
ständigkeitserklärung) betont. Die Begründungen sind dabei z.T. unterschiedlich: So 
argumentiert die DFG professionsethisch, die dghd und das Rechtsgutachten stellen 
prüfungsrechtliche Aspekte in den Vordergrund. Datenschutz- und urheber- 
schutzrechtliche Gesichtspunkte werden ebenfalls in allen Beiträgen angesprochen, 
jedoch wiederum verschieden stark gewichtet. In Bezug auf die Bewertung von 
Prüfungen etwa rät Hoeren in seinem Rechtgutachten von der Nutzung kommer- 
zieller KI-Textgeneratoren ab.°° 

In allen Beiträgen wird weiterer Normierungsbedarf artikuliert, wobei dieser 
mal stärker (dghd, Ethikrat) und mal schwächer (DFG, Rechtgutachten) ausfällt. 
Diese Unterschiede lassen sich z.T. durch die verschiedenen Kontexte und die Ro- 
bustheit der entsprechenden Normordnung erklären. Härtere und weiche Formen 
normativer Selbstverständigung und Ordnung bleiben aufeinander verwiesen. Der 
wissenschaftliche Diskurs ist durch die Entwicklung von KI-Textgeneratoren zu 
einer Reflexion seiner Werte aufgefordert. Der Austausch darüber verläuft rasant 
und es werden innerhalb kurzer Zeit Entscheidungen getroffen, die womöglich 
Pfadabhängigkeiten mit sich bringen. Es ist also jetzt die Zeit, zu klären, welche 
normativen Ansprüche über die Forderung nach Transparenz hinaus das wissen- 
schaftliche Schreiben zukünftig definieren. 


50 Vgl. oben Anm. 46. 


Felix Hermonies 
KI in der Rechtswissenschaft: 
ChatGPT ernst nehmen? 


Abstract: Jurisprudence sees itself as an argumentative accompaniment to the de- 
velopment of law and the setting of norms. Contributions to this are published and 
discussed. Sovereign decision-makers also have to justify their actions in certain 
situations. In this context, the inclusion of artificial intelligence and automated text 
generators raises questions about the possibilities and limits of law or reality. 


1 Rechtswissenschaft als Begleitung der 
Rechtsentwicklung im Diskurs 


Im Mittelpunkt der Rechtswissenschaft steht die Begleitung und Begutachtung des 
Rechts. Dabei stehen Rechtsnormen, Rechtsprechung oder auch rechtsverbindliche 
Entscheidungen von Hoheitsträgern im Mittelpunkt. Die Betrachtung richtet sich 
grundsätzlich auf alles, was in einem Rechtsstaat an durchsetzbaren Forderungen 
in Wirtschaft und Gesellschaft eine Rolle spielen kann. 

In der Rechtswissenschaft spielt ausdrücklich die Funktionsfähigkeit des Rechts 
gemessen an seinen Zielrichtungen eine große Rolle. Daher steht in der Geschichte 
der Rechtswissenschaft immer schon das Thema der Gerechtigkeit beziehungsweise 
das, was aktuell oder individuell darunter verstanden wird, im Fokus. Spätestens 
damit wird deutlich, dass in der Rechtswissenschaft beispielsweise im Unterschied 
zu den Naturwissenschaften Schlussfolgerungen schwerlich zu dem Ergebnis falsch 
oder richtig, wahr oder unwahr führen können. So lebt die Auseinandersetzung in 
der Rechtswissenschaft von der Kraft der Argumentation, die gegebenenfalls 
überzeugend, vertretbar beziehungsweise nicht vertretbar, eventuell auch als 
schwer nachvollziehbar angesehen werden kann." 

Vor diesem Hintergrund gehen die Beurteilung und Auseinandersetzung mit 
dem Recht und den Rechtsnormen regelmäßig mit der Frage der Bewertung und der 
Heranziehung von Werten einher. Besonders interessant gestalten sich dabei auch 
die Diskussionen zu sich widersprechenden Werten, sogenannte Zielkonflikte. Ge- 
rade in Diskussionen über Regelungen beispielsweise durch Strafbarkeitsandro- 
hungen bei Drogenkonsum oder Schwangerschaftsabbruch oder auch, wenn Um- 


1 Bernd Rüthers et al., Rechtstheorie, Heidelberg “2022, 586-588. 


8 Open Access. © 2024 bei den Autorinnen und Autoren, publiziert von De Gruyter. Dieses Werk ist 
lizenziert unter einer Creative Commons Namensnennung - Nicht kommerziell - Keine Bearbeitung 4.0 International 
Lizenz. https:/doi.org/10.1515/9783111351490-020 
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weltschutz- oder Verbraucherschutzvorschriften Auswirkungen auf den rechtlich 
geschtitzten Wettbewerb haben, zeigt sich auch immer wieder eine interessenge- 
pragte Argumentation. 

Das macht sehr schnell deutlich, dass ein erfolgreiches Ergebnis in der 
rechtswissenschaftlichen Auseinandersetzung nicht als falsch oder wahr angese- 
hen werden kann, sondern als vertretbar, vielleicht auch als Teil eines sich entwi- 
ckelnden Konsenses.” In dem Zusammenhang wird auch schon seit langer Zeit die 
Frage diskutiert, welche Bedeutung einer sogenannten herrschenden Meinung in 
der Literatur zukommt.” Nur weil eine bestimmte Position von vielen vertreten 
wird, mag das vielleicht demokratietheoretisch legitimierend wirken, belegt aber 
nicht eine wie auch immer einzuordnende Richtigkeit. Nur weil viele etwas sagen, 
muss es nicht wahr oder richtig sein.* 

In dem gleichwohl verfolgten Anspruch, möglichst das „richtige Recht“ im Sinne 
von größtmöglicher Gerechtigkeit zu finden, ist über die Jahre, insbesondere nach 
der Nazi-Diktatur, der Diskurs, insbesondere der offene Diskurs, entstanden und in 
der Hoffnung entwickelt worden, so möglichst weitgefächert Argumente und Lö- 
sungsansätze zu finden und zu diskutieren, welche den Erkenntnisprozess voran- 
bringen können. So werden in der Rechtswissenschaft Rechtsentwicklungen ins- 
besondere in Form von Normsetzungen, aber auch in Rechtsprechungen, in den 
Kontext der juristischen Wahrnehmung eingeordnet, mit Erfahrungen aus der 
Vergangenheit verglichen und an den verschiedenen Zielsetzungen gemessen. 

Der rechtswissenschaftliche Anspruch geht dabei auch auf eine Metaebene, in 
der das eigene Vorgehen, das Denken und die Bewertung hinterfragt werden. Wenn 
beispielsweise das Vorgehen beziehungsweise die Argumentation zum Verständnis 
und Ermittlung des Inhalts von Normen standardisiert sind, anhand von Sprache, 
systematischer Einordnung, historischem Kontext oder dem „Sinn/Zweck“ eines 
Gesetzes („Telos“), muss im Diskurs immer wieder auch die Möglichkeit bestehen, 
die jeweilige Vorgehensweise überprüfen und hinterfragen zu können. Das kann 
auch als Selbstreflexion der am Diskurs Beteiligten begriffen werden.’ 


2 Dazu ausführlich Jürgen Habermas, Moralbewusstsein und kommunikatives Handeln, Frankfurt 
a.M. 1983. 

3 Mit einem Überblick Bernadette Tuschak, Die herrschende Meinung als Indikator europäischer 
Rechtskultur, Hamburg 2009. 

4 Rüthers et al. 2022. 

5 Vgl. so in der Rechtsprechung des Bundesverfassungsgerichts beispielsweise im Urteil des 
Zweiten Senats vom 19.3.2013, Aktenzeichen 2 BvR 2628, 2883/10, 2155/11 („Verständigungsgesetz“), in 
der amtlichen Entscheidungssammlung BVerfGE 133, 168, Rn. 66. 
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Insgesamt gestaltet sich so die Offenheit der Argumentation in der Rechtswis- 
senschaft als eine kreative Leistung. Damit erscheinen die Einsatzmöglichkeiten 
eines KI-basierten Textgenerators, also immer noch einer Maschine, zumindest 
fraglich und zweifelhaft.” 


2 Der Blick der Rechtswissenschaft auf KI 


Wie auch sonst wird der Einsatz von KI beziehungsweise KI-basierten Textgene- 
ratoren als gesellschaftliche oder technische Entwicklung im rechtswissenschaftli- 
chen Diskurs begleitet.” Bei der Frage der Bewertung und rechtlichen Einordnung 
steht vor allen Dingen im Vordergrund, welche Rechtsgüter vor der KI zu schützen 
sind? und in welcher Art und Weise welcher Gesetzgeber darauf zu reagieren hat. 
Diskutiert wird naturgemäß beispielsweise schon der Entwurf der Europäischen 
Union zu einer KI-Verordnung und die Wirksamkeit und Richtigkeit der Ansätze 
ihrer Regelungen." 

Daneben wird auch am Maßstab bereits bestehender rechtlicher Rahmenbe- 
dingungen wie den Haftungsregelungen des Bürgerlichen Gesetzbuchs über die 
Einsatzmöglichkeiten und -grenzen von KI beispielsweise im Zusammenhang mit 
selbstfahrenden Autos diskutiert. Auch die Gefahren von Diskriminierung beim 
Einsatz in Bewerbungsprozessen sind ein naheliegendes Thema." Auch innerhalb 


6 Markus Würdinger, „Juristische Kreativität“, JuristenZeitung, 2023, 397-403. 

7 Angelika Nußberger, „Die Wissenschaftskultur der Staatsrechtslehre in der Welt von ChatGPT“, 
Deutsches Verwaltungsblatt, 2023, Heft 17, I-II, I. 

8 Umfassend zu ChatGPT Thomas Wilmer, „Rechtsfragen bei ChatGPT & Co., Kommunikation und 
Recht“, 2023, 233-240, und ders., „Rechtsfragen bei DALL-E & Co. — Schutzfähigkeit der „Prompto- 
grafie?“, Kommunikation und Recht, 2023, 385-395; Ulrich Baumgartner, „Anforderungen der DS-GVO 
an den Einsatz von Künstlicher Intelligenz. Welche Regeln gelten für Anbieter und Anwender?“, 
MultiMedia und Recht, 2023, 543-547, 

9 Thomas Wilmer, „Rechtliche Rahmenbedingungen für KI-Systeme, Immanente Herausforderun- 
gen und mögliche Lösungen durch Control by Design“, Zeitschrift für Technikfolgenabschätzung in 
Theorie und Praxis, 2021, 56-62; Renate Schaub, „Nutzung von Künstlicher Intelligenz als Pflicht- 
verletzung? Sorgfaltspflichten beim Einsatz generativer Künstlicher Intelligenz“, Neue Juristische 
Wochenschrift, 2023, 2145-2150. 

10 Mario Martini et al., „KI-VO, DMA und DA als Missing Links im Kampf gegen dunkle Design- 
muster? Das Digitalpaket der Union und seine vielschichtigen Regelungsansätze gegen Dark Pat- 
terns“, MultiMedia und Recht, 2023, 399-403; Johann Justus Vasel, „Künstliche Intelligenz und die 
Notwendigkeit agiler Regulierung“, Neue Zeitschrift für Verwaltungsrecht, 2023, 1298-1303. 

11 Uwe Meyer, „Künstliche Intelligenz im Personalmanagement und Arbeitsrecht“, Neue Juristische 
Wochenschrift, 2023, 1841-1847, 1846; Friederike Malorny, „Datenschutz als Grenze KI-basierter 
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der „klassischen“ juristischen Tätigkeitsfelder werden Einsatzmöglichkeiten disku- 
tiert,” wenn es beispielsweise um die Durchführung von Verfahren bei Behorden™ 
und Gerichten™ geht oder auch um die Frage, ob sich mit KI gerichtliche Ent- 
scheidungen vorhersehbar machen lassen.'° Das zeigt sich auch in den Ansätzen zur 
Verwaltungsautomation’® oder bei der Erfassung von Tatsachenangaben in Fin- 
zelfällen, die teilweise schon softwarebasiert erfolgt.'” Dabei ist festzuhalten, dass 
bei der Aufnahme von Informationen Gefahren bestehen, wenn beispielsweise 
fehlerhaft zwischen Relevantem und Irrelevantem unterschieden wird; Fehler, zu 
denen regelmäßig aber auch Menschen neigen. Perspektivisch lassen sich aber 
Verwendungsszenarien entwickeln bei der Pflege von digitalen Akten”* als auch der 
Aufbereitung von Aussagen und technischen Gutachten in Gerichts- oder Behör- 


Auswahlentscheidungen im Arbeitsrecht“, Recht der Arbeit, 2022, 170-178; Bernd Waas, KI und Ar- 
beitsrecht, Recht der Arbeit, 2022, 125-131, 128-129. 

12 Simon Lobinger, ,(Chat-)GPT in der juristischen Leistungserbringung — Möglichkeiten und 
Grenzen“, Legal Tech, 2023, 187-194. 

13 Dorothea Mund, „Das Recht auf menschliche Entscheidung. Die Vorgaben des Grundgesetzes 
angesichts des Einsatzes Künstlicher Intelligenz bei der vollziehenden Gewalt“, Legal Tech, 2023, 85- 
92. 

14 Ausführlich Tianyu Yuan, „Justiz GPT: Möglichkeiten und Grenzen des Einsatzes generativer 
Sprachmodelle bei gerichtlichen Entscheidungen“, Legal Tech, 2023, 195-202; Rikmor Elsa Winkel- 
mann, „Entscheidungsfindung durch Künstliche Intelligenz in der Justiz“, Legal Tech, 2023, 163-170; 
Johann Justus Vasel, „Künstliche Intelligenz in der Justiz“, Legal Tech, 2023, 179-186; Simon ]. 
Heetkamp/Christian Schlicht, „Digitalisierungsprozesse und Grenzen für Künstliche Intelligenz in 
der Justiz“, Legal Tech, 2023, 177-179. 

15 Konstantin Kuchenbauer, „Der gläserne Richter, Big-Data-Analyse als Mittel zur Vorhersehbar- 
keit richterlicher Entscheidungen?“, JuristenZeitung, 2021, 647-655. 

16 So auch $35a Verwaltungsverfahrensgesetz in Bezug auf behördliche Entscheidungen durch 
einen sog. Verwaltungsakt: „Ein Verwaltungsakt kann vollständig durch automatische Einrichtungen 
erlassen werden, sofern dies durch Rechtsvorschrift zugelassen ist und weder ein Ermessen noch 
ein Beurteilungsspielraum besteht.“ 

17 So soll auch unter Einsatz von Software die Authentifizierung von Personen festgestellt werden 
können, s. $ 2 Absatz 3 E-Government-Gesetz des Bundes: „Jede Behörde des Bundes ist verpflichtet, 
in Verwaltungsverfahren, in denen sie die Identität einer Person auf Grund einer Rechtsvorschrift 
festzustellen hat oder aus anderen Gründen eine Identifizierung für notwendig erachtet, einen 
elektronischen Identitätsnachweis nach $ 18 des Personalausweisgesetzes, nach $ 12 des eID-Karte- 
Gesetzes oder nach $ 78 Absatz 5 des Aufenthaltsgesetzes anzubieten.“ 

18 Vgl. § 6 E-Government-Gesetz des Bundes: „Elektronische Aktenführung“: „Die Behörden des 
Bundes sollen ihre Akten elektronisch führen. (...) Wird eine Akte elektronisch geführt, ist durch 
geeignete technisch-organisatorische Mafsnahmen nach dem Stand der Technik sicherzustellen, dass 
die Grundsätze ordnungsgemäßer Aktenführung eingehalten werden.“ 
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denverfahren.'” Demgegenüber wirkt schon die Überlegung eines Einsatzes von KI 
bei der eigentlichen Entscheidung befremdlich: 


Wer den Algorithmus entwickelt und kontrolliert, der bestimmt die Ergebnisse. Hier kann es 
schnell zu tendenziösen oder falschen Ergebnissen, politischen Beeinflussungen oder rassis- 
tischen Diskriminierungen kommen. Transparenz der Algorithmen und die Möglichkeit, die 
Systeme durch unabhängige Dritte überprüfen zu lassen, sind daher das A und O bevor man 
entsprechende KI-Systeme beispielsweise im Bereich des staatlichen Handelns einführt.” 


So geht auch die geltende Rechtsordnung bei Gerichts- und Behördenentschei- 
dungen davon aus, dass Menschen hier tätig und ursächlich sind.”' Nur sie sind 
schließlich auch verantwortlich für das Ausmaß und die sozialen Wirkungen ihrer 
Entscheidungen. Eine Zuordnung von Verantwortung zu Maschinen ist nicht 
denkbar und rechtlich nicht möglich. Gesetze sehen beim Einsatz von Maschinen, 
Technik oder auch Organisationen dann gegebenenfalls die sogenannte Betriebs- 
oder Organisationsverantwortung/-haftung vor die den Menschen zugeordnet 
wird.” 

So wie aber auch schon bisher bei staatlichem oder auch privatem Handeln 
Dienstleistungen, insbesondere digitale Dienstleistungen wie beispielsweise Such- 


19 Eric Hilgendorf/Matthias Lippold, „Tagungsbericht, Künstliche Intelligenz — Herausforderungen 
und Chancen“, JuristenZeitung, 2023, 513-514, 514. 

20 Dieter Kugelmann, „Neue Inhalte zu KI und ChatGPT“, Datenschutz und Datensicherheit, 2023, 
202. 

21 Yuan 2023, 199-200; Mund 2023, 86-88. 

22 S. dazu $ 831 Absatz 1 Bürgerliches Gesetzbuch: „Wer einen anderen zu einer Verrichtung be- 
stellt, ist zum Ersatz des Schadens verpflichtet, den der andere in Ausführung der Verrichtung ei- 
nem Dritten widerrechtlich zufügt. Die Ersatzpflicht tritt nicht ein, wenn der Geschäftsherr bei der 
Auswahl der bestellten Person und, sofern er Vorrichtungen oder Gerätschaften zu beschaffen oder 
die Ausführung der Verrichtung zu leiten hat, bei der Beschaffung oder der Leitung die im Verkehr 
erforderliche Sorgfalt beobachtet oder wenn der Schaden auch bei Anwendung dieser Sorgfalt 
entstanden sein würde.“ 

23 In diesem Kontext kann aber angemerkt werden, dass im Wirtschaftsverkehr, Verantwortung 
und Haftung realistischer Weise häufig juristischen Personen (Aktiengesellschaften, Gesellschaften 
mit beschränkter Haftung) zugeordnet wird, für die natürliche Personen beispielsweise als Vor- 
stand usw. handeln. Da kann die Frage gestellt werden, was die Zuordnung und Haftung in Bezug auf 
juristische Personen der auf Maschinen unterscheidet. In extremen Fällen müssen sich die Men- 
schen, die Aufsichtspflichten verletzt haben, strafrechtlich verantworten. Die materielle zivil- 
rechtliche Haftung insbesondere für Schadensersatz dürfte aber interessanter in Bezug auf die 
juristische Person und die damit vermutlich zur Verfügung stehende Haftungsmasse sein. Auch bei 
theoretisch schwer vorstellbaren Schäden durch Textgeneratoren müsste also danach gefragt 
werden, wer genau für den Einsatz verantwortlich ist und ggf. dabei Pflichten verletzt hat. 
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maschinen, eingesetzt wurden, um die Sach- oder Rechtslage zu ermitteln,”* ist 
nicht auszuschließen, dass auch KI-basierte Dienstleistungen hier zum Einsatz 
kommen. Auch hier wird es aber kritisch, da für Behörden und teilweise auch 
Gerichte der Amtsermittlungsgrundsatz gilt.” Mit einer gewünschten Delegation 
der Recherche auf eine KI-basierte Anwendung wird die Grenze des Zulässigen 
schon dann erreicht werden, wenn nicht nachvollzogen werden kann, wie (mit 
welchem Algorithmus) recherchiert wurde, wie die Ergebnisse bewertet und 
eventuell in einer Rangfolge eingeordnet wurden und schließlich in einem Text ein 
bestimmtes Ergebnis von Sach- oder Rechtslage vorgeschlagen wird. 


3 Einwirkungsmoglichkeiten von KI auf die 
Rechtswissenschaft? Überlegungen zu einer 
möglichen Beteiligung am Diskurs 


Im Zusammenhang mit der Entwicklung von Textgeneratoren durch künstliche 
Intelligenz stellt sich die Frage nach ihren Beteiligungsmöglichkeiten auch im 
rechtswissenschaftlichen Bereich. 

Neben den bereits erwähnten Bewertungen und Einordnungen von Rechts- 
entwicklungen liegt es naturgemäß an Menschen, neue Impulse zu geben und An- 
reize beziehungsweise Ideen in die Diskussion miteinzubringen, an die vorher noch 
keiner gedacht hat. Das ist bei einer Maschine schwer vorstellbar und erscheint 
dann eher als Zufallstreffer. Zu einem anderen Ergebnis ließe sich vielleicht bei 
einer vergleichenden Betrachtungsweise mit bekannten Vorgehensweisen wie in 
der Naturwissenschaft gelangen. Wenn dort zur Weiterentwicklung von Technik 
beispielsweise von Autos die Funktionsfähigkeit und Fortbewegung bei Tieren 
analysiert, verglichen und auf Übertragungsmöglichkeiten auf Autos untersucht 
wird, kann nicht ausgeschlossen werden, dass auch eine KI zu solch einer verglei- 


24 Beispielsweise kann im Einzelfall nach den Regelungen des Einführungsgesetzes zum Bürger- 
lichen Gesetzbuche bei manchen internationalen Familienrechtsstreitigkeiten die Gesetzes- und 
Rechtslage in den Heimatländern der Beteiligten angewendet werden. Das kann zur rechtlichen 
Pflicht einer aufwändigen Recherche führen. 

25 Vgl. die Schutzregelung in $ 24 Absatz 1 Verwaltungsverfahrensgesetz: „Untersuchungsgrund- 
satz“: „Die Behörde ermittelt den Sachverhalt von Amts wegen. Sie bestimmt Art und Umfang der 
Ermittlungen; an das Vorbringen und an die Beweisanträge der Beteiligten ist sie nicht gebunden. 
Setzt die Behörde automatische Einrichtungen zum Erlass von Verwaltungsakten ein, muss sie für den 
Einzelfall bedeutsame tatsächliche Angaben des Beteiligten berücksichtigen, die im automatischen 
Verfahren nicht ermittelt würden.“, vgl. Mund 2023, 90-91. 
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chenden und damit auch kreativen Arbeitsweise fähig ist.” Ebenso könnte eine 
hoch entwickelte KI durch Recherche ermitteln, dass in einer anderen Rechtsord- 
nung bestimmte dort geltende Regelungen zur Lösung eines Streitfalls herangezo- 
gen werden, was dann als Vorschlag für ein neues Gesetz oder einen Vertragsent- 
wurf vorgelegt wird. 

Daneben ist die Bewertung der Einsatzmöglichkeiten von KI im rechtswissen- 
schaftlichen Diskurs angesichts der dynamischen Entwicklung und Weiterent- 
wicklung der Technik naturgemäß schwierig.” So gibt es in der juristischen Lite- 
ratur den Bericht über einen Versuch, bei dem deutlich wurde, dass in KI- 
generierten Texten (beziehungsweise dort in einem Dialog mit ChatGPT) die an- 
geblich zugrunde gelegten Quellen gar nicht existierten.”* Das lässt eine KI-basierte 
Textgenerierung und Beteiligung an Diskursen zunächst absurd erscheinen. Wenn 
aber in der Weiterentwicklung eine KI-Anwendung die Vorgabe bekommt, sich nur 
an tatsächlich vorhandenen Quellen zu orientieren, so wie beispielsweise auch 
Suchmaschinen funktionieren, wenn auf die Links auch geklickt werden kann, wäre 
eine andere Verwertbarkeit diskussionswürdig. So könnte sogar die Nachvollzieh- 
barkeit als Voraussetzung gelten, damit ein Beitrag zum Diskurs geleistet werden 
kann. 

In der weiteren Überlegung scheinen Textgeneratoren zwar zur Gestaltung von 
Argumentation oder Argumentationsketten imstande zu sein, aber die eingangs 
dargestellten erfolgenden Bewertungen und Wertungsmöglichkeiten wären ange- 
sichts der sonst häufig zugrundeliegenden rechtspolitischen Zielrichtung hier zu- 
nächst einmal als willkürlich einzuordnen. 

Auch bei der Frage zu den Einsatzmöglichkeiten in der Justiz, die sich spätes- 
tens auf höchstrichterlicher Ebene auch mit den Positionen der Rechtswissenschaft 
auseinandersetzt, ist aus verfassungsrechtlicher Sicht hervorzuheben, dass Arti- 
kel 92 des Grundgesetzes von „Richtern“ spricht.” Auch Artikel 101 Absatz 1 Satz 2 
Grundgesetz verankert einen Anspruch auf einen gesetzlichen „Richter“. Wenn 
gleichwohl eine KI beispielsweise zu Recherchezwecken oder zur Aufbereitung von 
herangezogenen Daten herangezogen wird, stehen die Gerichte in der Pflicht, 
nachvollziehbar beziehungsweise überprüfbar zu machen, inwiefern die einge- 


26 Würdinger 2023, 398, mit Verweis auf die Diskussion zum „Biegen, Brechen und Verbinden“ als 
die „drei grundlegenden kognitiven Strategien der Kreativität“. Vgl. auch Nußberger 2023. 

27 Ruth Fulterer, „Chat-GPT wird immer dümmer. Was ist da los?“, Neue Zürcher Zeitung, 31.07.2023, 
in [www.nzz.ch/technologie/ld.1748197] (Zugriff: 02.10.2023). 

28 Jan-Erik Schirmer, „ChatGPT: (K)eine Zukunft für Kommentare?“, JuristenZeitung, 2023, 144-146. 
29 Artikel 92 Grundgesetz: „Die rechtsprechende Gewalt ist den Richtern anvertraut ...“. 

30 Artikel 101 Absatz 1 Grundgesetz: „Ausnahmegerichte sind unzulässig. Niemand darf seinem 
gesetzlichen Richter entzogen werden.“ 
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setzten Dienste die Verantwortung der Entscheidung beeinflussen, verkürzen oder 
gar beeinträchtigen können.” Auch die Unabhängigkeit von Richtern nach Arti- 
kel 97 Grundgesetz” kann dann gefährdet sein, wenn eine Datenbank-abhängige 
Entscheidung in eine bestimmte Richtung führt. Schließlich setzen die deutsche 
Verfassung wie daneben auch internationale Konventionen den Anspruch auf ein 
rechtliches Gehör oder auf Anhörung sowohl in der Justiz”? als auch bei Verwal- 
tungsentscheidungen** fest. Dieser Anspruch darf auch durch den Einsatz von KI 
bei Eingabemasken oder Ähnlichem nicht entscheidend verkürzt werden.” Bür- 
gerinnen und Bürger müssen mit ihrem Vorbringen gehört werden können. Un- 
abhängig davon wird diskutiert, inwiefern die rechtskonform gesammelten Fakten 
dann wiederum durch digitale Assistenzmodelle und KI aufbereitet und analysiert 
werden können. 

Im Zusammenhang mit den potenziellen Einsatzmöglichkeiten steht dann die 
Frage der Transparenz der Arbeitsweise und die Gefahr der Manipulierbarkeit bei 
der Generierung von Texten einschließlich der dabei verwerteten Quellen. Ist eine 
Argumentation unter Hinzuziehung von Quellen nachvollziehbar und überprüfbar, 
insbesondere auch warum welche Quellen in welcher Rangfolge einbezogen wur- 
den, scheinen theoretisch weniger Bedenken zu bestehen. Wenn aber außerhalb 
einer theoretischen Diskussion über konkretere Einsatzmöglichkeiten nachgedacht 
wird und menschliches Handeln ersetzt werden soll, bekommt die Frage der Hoheit 
über den Algorithmus beziehungsweise der Verantwortlichkeit für die Gestaltung 
des Algorithmus eine ganz andere Bedeutung. So können auf der Basis des Algo- 
rithmus Vorgehensweise und Ergebnis der Arbeit einer KI und der daraus folgenden 
Textgestaltung bestimmt werden.*® 


31 Yuan 2023, 195-197. 

32 Artikel 97 Absatz 1 Grundgesetz: „Die Richter sind unabhängig und nur dem Gesetze unter- 
worfen.“ 

33 Artikel 101 Absatz 1 Grundgesetz: „Vor Gericht hat jedermann Anspruch auf rechtliches Gehör.“ 
Roman Poseck, „Zu den Möglichkeiten und Grenzen des Einsatzes von Künstlicher Intelligenz in der 
Justiz“, Legal Tech 2023, 73-74. 

34 Beispielsweise $ 28 Absatz 1 Verwaltungsverfahrensgesetz: „Bevor ein Verwaltungsakt erlassen 
wird, der in Rechte eines Beteiligten eingreift, ist diesem Gelegenheit zu geben, sich zu den für die 
Entscheidung erheblichen Tatsachen zu äußern.“ 

35 Auch in Artikel 41 Absatz 2 Grundrechte-Charta der EU und in Art. 6 Europäische Menschen- 
rechtskonvention. 

36 Teilweise auch als „Algokratie“ bezeichnet, Arne Pilniok, „Administratives Entscheiden mit 
Künstlicher Intelligenz: Anwendungsfelder, Rechtsfragen und Regelungsbedarfe“, JuristenZeitung, 
2022, 1021-1031, 1022, m. w. N. Zur Verhinderung von missbräuchlichen Einsatzmöglichkeiten der KI 
s. a. die sog. „Hambacher Erklärung der Deutschen Datenschutzkonferenz“, 03.04.2019, Entschlie- 
ung der 97. Konferenz der unabhängigen Datenschutzaufsichtsbehörden des Bundes und der Länder, 
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Wenn schließlich aber den KI-basierten Textgeneratoren dieselben Datenban- 
ken beispielsweise aus juristischen Fachzeitschriften zur Verfügung stehen wie 
Menschen, verschiebt sich der Fokus eher auf die Frage nach den technischen 
Grenzen der Verbesserungsmöglichkeiten. Mit der Beschreibung „Intelligenz“ 
drängt sich die Vergleichbarkeit zum menschlichen Vorgehen auf. Hier lässt sich 
das bereits mehrfach zum Vergleich herangezogene Beispiel der Entwicklung von 
Schachcomputern zitieren. Auch dort wurde zu Beginn bezweifelt, ob und inwie- 
weit ein qualitativ hochwertiges Spiel möglich sein kann. Heute wird allgemein 
davon ausgegangen, dass Schachcomputer „besser“ als Menschen spielen können.?” 

Die Verbesserung des Diskurses durch KI-basierte Textgeneratoren scheint so 
jedenfalls nicht ausgeschlossen. Das verführt dann zu dem Schluss, dass sie auch 
nicht verhindert werden darf. Die schlichte These, dass von Menschen geführte 
Diskurse bestimmte Argumente übersehen oder mögliche logische Schlüsse nicht 
ziehen, führt zu der Frage, warum Techniken und Dienstleistungen, die für diese 
Fehler weniger anfällig sein können, verhindert werden sollen.** 

Letztlich bleibt es den Menschen überlassen, die Beiträge im Diskurs zu 
überprüfen oder zu bewerten, unabhängig ob sie von Menschen oder Maschinen 
stammen. Wie auch sonst kann die Überzeugungskraft der jeweiligen Beiträge an 
ihrer Nachvollziehbarkeit, Überprüfbarkeit und Vertretbarkeit festgemacht wer- 
den. Wenn, wie oben dargestellt, perspektivisch (aufgrund geschaffener Verifizie- 
rungsmöglichkeiten) die Erfindung von Quellen ausgeschlossen werden kann, 
könnten Bedenken soweit eventuell ausgeschlossen werden. Daran schließt sich 
auch die Notwendigkeit von Kennzeichnungen und entsprechenden Pflichten an.” 

Unter dem Gesichtspunkt der Nachvollziehbarkeit beziehungsweise Transpa- 
renz der Arbeitsweise von KI, wird, wie auch sonst bei der Einführung neuer 
Techniken, immer wieder die Möglichkeit des Einsatzes von Zertifizierungen durch 
(staatlich) akkreditierte Anbieter diskutiert.“ Das mag grundsätzlich für Techniken 


Hambacher Schloss, in [www.datenschutzkonferenz-online.de/media/en/20190405_hambacher_erk 
laerung.pdf] (Zugriff: 02.10.2023). 

37 Mirjam Hauck, „25 Jahre ‚Deep Blue‘: Mensch, ärgere dich nicht“, Süddeutsche Zeitung, 10.02. 
2021, in [www.sueddeutsche.de/wirtschaft/schach-deep-blue-kasparow-ibm-41.5200655] (Zugriff: 
02.10.2023). 

38 Vgl. Martin Eifert/Matthias Lippold, „Tagungsbericht, Künstliche Intelligenz — Herausforde- 
rungen und Chancen“, JuristenZeitung, 2023, 513-514, 513, wonach schon das Gebot rationaler 
Herrschaft, verankert in der Verfassung, dazu dränge, die Nutzung von Optimierungsmöglichkeiten 
durch eine KI zu unterstützen. 

39 Dominik Höch/Jonas Kahl, „Anforderungen an eine Kennzeichnungspflicht für KI-Inhalte“, 
Kommunikation und Recht, 2023, 396-400. 

40 Marit Hansen et al., „Tagungsbericht, Qualität künstlicher Intelligenz: Bewertung, Sicherung, 
Anwendungsbeispiele“, JuristenZeitung, 2023, 146-148, 147. 
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denkbar sein. Aber auch dann bleibt im wissenschaftlichen Kontext die Frage der 
Überprüfbarkeit der Zertifizierung bestehen. Wenn schon kaum nachvollziehbar 
scheint, wie eine KI zu Ergebnissen oder der Gestaltung von Texten gelangt, wie soll 
dann durch eine Zertifizierung bestätigt werden können, dass die Vorgehensweise 
bestimmten (welchen?) Maßstäben der Erkenntnisgewinnung folgt. 

Als die Diskussion entscheidendes Argument wird schließlich immer wieder 
darauf verwiesen, dass eine für die Rechtswissenschaft typische und wertende 
Betrachtungsweise eigentlich nur Menschen möglich sei. Das führt zu der Frage, 
was Grundlage für Wertentscheidungen beim Menschen ist und inwiefern eine von 
Menschen geführte und veröffentlichte Argumentation, welche sich an Werten, 
Zielen, Maßstäben, Motivationen usw. orientiert, überprüfbar ist: Kann nicht auch 
eine von Maschinen geführte Argumentation und Bewertung überprüfbar sein? 
Wenn dann eine Beteiligungsmöglichkeit für Textgeneratoren vorstellbar scheint, 
wird vielleicht eher die Frage aufkommen, inwieweit einzelne Beiträge die Grenze 
des Erträglichen erreichen. So ist schon jetzt manche von Menschen geführte 
hochpolitische Diskussion, gegebenenfalls noch mit großer Emotionalität versehen, 
teilweise schwer zu ertragen.*' Wie kann sich das noch entwickeln, wenn sich 
daran eine ethisch-moralisch ungeschulte KI beteiligt?” 

Wie schon dargestellt scheint theoretisch auch dabei eine Weiterentwicklung 
nicht ausgeschlossen. Wenn Wertvorstellungen und Maßstäbe, die für die Men- 
schen zu einer bestimmten Argumentation führen, der KI zur Verfügung gestellt 
werden und sie unter Verweis auf die jeweiligen Maßstäbe nachvollziehbar zu ei- 


41 Zu der grundsätzlichen Diskussion Graziana Kasti-Riemann, „Algorithmen und Künstliche In- 
telligenz im Äußerungsrecht“, Zeitschrift für Urheber- und Medienrecht, 2023, 578-585. Zu Gesetz- 
gebungsnotwendigkeiten Amelie Berz et al., „KI, Datenschutz, Hassrede und Desinformation. Zur 
Regulierung von KI-Meinungen“, Zeitschrift für Urheber- und Medienrecht, 2023, 586-594. 

42 Beispielsweise bei dem Konflikt zwischen Satirefreiheit und Persönlichkeitsrecht: der Journalist 
Deniz Yücel war von einem Gericht zu Schadensersatz verurteilt worden für einen Satz in der 
Tageszeitung mit dem Wortlaut: „Buchautor Thilo S., den man, und das nur in Klammern, auch dann 
eine lispelnde, stotternde, zuckende Menschenkarikatur nennen darf, wenn man weiß, dass dieser 
infolge eines Schlaganfalls derart verunstaltet wurde und dem man nur wünschen kann, der 
nächste Schlaganfall möge sein Werk gründlicher verrichten“, Legal Tribune Online, 16.08.2013, in 
[https:/tip.de/nwuz5] (Zugriff: 02.10.2023). Oder auch bei der Diskussion über die Klagen der frü- 
heren Ministerin Künast gegen Kommentare in sozialen Netzwerken wie beispielsweise „Gehirn- 
Amputiert“ usw. anhand derer ein Konflikt zwischen Meinungsfreiheit und Persönlichkeitsrecht 
diskutiert wurde, Felix W. Zimmermann, Legal Tribune Online, 02.02.2022, in [https://tip.de/5x49b] 
(Zugriff: 02.10.2023). 


KI in der Rechtswissenschaft: ChatGPT ernst nehmen? — 339 


nem bestimmten Ergebnis kommt, bleibt mehr die Frage nach der technischen 
Machbarkeit als der Begrenzungsnotwendigkeit.** 

Schließlich kann hier in Fortführung der Ausführungen oben, zur rechtlichen 
Einordnung von KI-Anwendungen auch noch festgehalten werden, dass eine KI- 
Technik selbst, die Texte generiert, den allgemeinen rechtlichen Rahmenbedin- 
gungen bei ihrem Einsatz unterliegt. Im Diskurs, bei dem sonst Menschen beteiligt 
sind, gilt dann ebenfalls für Maschinen das Technikrecht. Im Unterschied dazu aber 
sind Äußerungen und Beteiligungen von Menschen grundrechtlich geschützt. Dazu 
kommt neben der Meinungsfreiheit die Wissenschaftsfreiheit zum Tragen.“* Bei 
einer diskursgeprägten Wissenschaft könnte auch noch überlegt werden, wie in 
einer theoretischen Auseinandersetzung unter Beteiligung einer Maschine ein 
Konflikt mit der Verfassung oder Grundrechten Anderer möglich ist. In Beispiels- 
fällen von verletzenden oder beleidigenden Inhalten kann eine KI kein „Täter“ sein. 
Vielmehr wird dann der durch Menschen folgende Akt der Weiterverbreitung KI- 
basierter Texte, die beispielsweise Persönlichkeitsrechte verletzen, im Fokus ste- 
hen.*° 

Weiter könnte überlegt werden, inwiefern eine KI-basierte Recherchetätigkeit 
mit anschließender Textgenerierung zu einer unzulässigen Nutzung von Daten 
insbesondere aus Datenbanken führt, die eigentlich zugriffsbegrenzt oder geheim 
sein sollten. Auch in diesem Kontext wurde schon in der Vergangenheit aus dem 
Blickwinkel des Datenschutzes diskutiert, inwiefern durch den Einsatz von KI-An- 
wendungen die Gefahr besteht, dass eigentlich als anonym oder anonymisiert gel- 
tende Datenbanken durch den Einsatz von KI wieder de-anonymisiert werden 
können und so Informationen über einzelne Menschen erkennbar gemacht werden 
können.” Auch das führt dann wieder zu der Frage der Verantwortung für den 
Einsatz der Text-generierenden KI. 


43 Auch wird schon überlegt, wie KI zur Bekämpfung von Hassrede eingesetzt werden kann, Jürgen 
Kühling, „Der Einsatz von Künstlicher Intelligenz durch Unternehmen und Aufsichtsbehörden bei 
der Bekämpfung von Hassrede“, Zeitschrift für Urheber- und Medienrecht, 2023, 566-573. 

44 Peter M. Huber, „Rechtsprechung und Rechtswissenschaft“, JuristenZeitung, 2022, 1-7, 7. 

45 Ausführlich Kasti-Riemann 2023, 578-580; Berz et al. 2023, 586-588. Vgl. auch Eva Maria Bredler/ 
Nora Markard, „Grundrechtsdogmatik der Beleidigungsdelikte im digitalen Raum. Ein gleichheits- 
rechtliches Update der Grundrechtsabwägung bei Hassrede“, JuristenZeitung, 2021, 864-872, 871, 
unter Verweis auf die Problematik äußerst umstrittener Zielkonflikte und ihrer Entscheidung durch 
Urteile, was beispielsweise auch die Unmöglichkeit von „Diskurs-Schiedsrichtern“ deutlich macht. 
46 Alexander Roßnagel/Christain L. Geminn, „Vertrauen in Anonymisierung, Regulierung der An- 
onymisierung zur Förderung Künstlicher Intelligenz“, Zeitschrift für Datenschutz, 2021, 487-490. 
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4 Fazit 


Es ist typisch für dynamische, technische Weiterentwicklungen, dass eine Einord- 
nung und rechtliche/rechtswissenschaftliche Bewertung unter Vorbehalt steht. 
Viele Szenarien sind schlichtweg nicht auszuschließen. Wenn beispielsweise 
Transparenz-, Überprüfungs- und Kennzeichnungsvorgaben eingehalten würden, 
wirkt das Potenzial von zu entwickelnden, neuen Argumenten oder Perspektiven 
durch KI-basierte Textgeneratoren verführerisch. Letztlich bleibt immer noch die 
wissenschaftliche Einordnung und Bewertung eines generierten Textes notwendig. 
Da momentan nicht erkennbar ist, wie die beschriebenen Vorgaben gestaltet und 
umgesetzt werden können, scheinen Einsatzmöglichkeiten aktuell (noch?) eher 
begrenzt. 


Jutta Jahnel/Reinhard Heil 
KI-Textgeneratoren als soziotechnisches 
Phänomen 


Ansätze zur Folgenabschätzung und Regulierung 


Abstract: AI text generators enable the automated generation of high-quality text 
that we might consider to be meaningful and human-created content. It is claimed 
that they represent a „game changer“ for science, business and society, as they 
would have a fundamental impact on the way we write, think and work. For a 
realistic assessment of the socio-technical phenomenon of Al text generators, the 
specific contexts of usage and concrete applications are crucial. This is reflected in 
the current draft ofthe AI Act which proposes a risk-based approach for assessing 
different AI applications. Technology assessment (TA) considers ethical and social 
implications of technologies and develops guidance for policymakers and society 
from an interdisciplinary perspective. The risks of Al text generators lie mainly in 
the area of data protection, discrimination and the possible spread of misinfor- 
mation. Furthermore, the malicious use ofthis technology causes new types offraud 
and cyber risks. This contribution uses the classification of possible risks at different 
levels for individuals, organizations and society to systematize the necessary mul- 
tidimensional regulatory measures. These include, in particular, transparency ob- 
ligations to combat deception and manipulation and to enhance the ability for a 
critical evaluation of generated content. In addition, broader societal impacts on 
communication and democratic processes need to be addressed. In general, the 
regulation of Al text generators includes technology-neutral approaches to ensure 
that fundamental rights such as data protection and copyright are respected. In 
addition, specific AI rules and requirements for foundation models are being de- 
veloped at the European level. 


1 Einleitung 


Mit neuen Methoden der Künstlichen Intelligenz (KI) ist die Erstellung und Ver- 
änderung von Medieninhalten wie Bilder, Texte, Audio- oder Videoinhalte einfach 
und kostengünstig möglich.' KI-basierte Chatbots erzeugen Texte, die sich von 


1 Mariétte van Huijstee et al., „Tackling Deepfakes in European Policy. Study. Panel for the Future of 
Science and Technology“, Publications Office of the European Union, 2021 (DOI: 10.2861/325063). 


8 Open Access. © 2024 bei den Autorinnen und Autoren, publiziert von De Gruyter. Dieses Werk ist 
lizenziert unter einer Creative Commons Namensnennung - Nicht kommerziell - Keine Bearbeitung 4.0 International 
Lizenz. https:/doi.org/10.1515/9783111351490-021 


342 —— Jutta Jahnel/Reinhard Heil 


Menschen geschriebenen Texten nur noch sehr schwer unterscheiden lassen.” 
Derartige KI-Textgeneratoren, wie bspw. ChatGPT,’ zählen zu den anschaulichen 
Anwendungsbeispielen der sogenannten „generativen KI“. Diese Systeme bieten 
enorme Chancen und viele Experten gehen von einem hohen disruptiven Potential 
aus, da sie die Art und Weise, wie wir denken, kommunizieren und arbeiten, er- 
heblich verändern kénnten.* 

Der vorliegende interdisziplinäre Tagungsband beschäftigt sich mit den mög- 
lichen Konsequenzen durch computergenerierte Texte. Dazu zählen insbesondere 
Risiken, mit denen wir als Nutzer von Textgeneratoren oder auch als Empfänger 
von generierten Inhalten umgehen müssen.’ Für die Entwicklung geeigneter Maß- 
nahmen, die mögliche Risiken eindämmen sollen, ist es zunächst wichtig, die 
Funktionsweise und Eigenschaften der zugrundeliegenden großen Sprachmodelle 
zu kennen und die möglichen Folgen in konkreten Nutzungs- und Anwendungs- 
kontexten zu betrachten. Dabei ist die gesamte Wertschöpfungskette von gene- 
rierten Texten und die dabei eingebundenen Akteure in den Blick zu nehmen. 
Neben den Entwicklern von Modellen für Textgeneratoren sind dies auch die An- 
wender der Modelle, die Programme wie ChatGPT oder Suchmaschinen betreiben, 
und auch die Nutzer dieser Anwendungen. Denn die Risiken von KI-Textgeneratoren 
liegen nicht nur in der Konzeption der Sprachmodellen selbst, sondern in der Art 
und Weise, wie solche Modelle und Systeme konkret genutzt werden. Dabei spielen 
in hohem Maße auch Risiken durch Missbrauch für böswillige Zwecke eine Rolle. 


2 Stephen Wolfram, „What Is ChatGPT Doing ... and Why Does It Work?“, 2023, in [https://writings. 
stephenwolfram.com/2023/02/what-is-chatgpt-doing-and-why-does-it-work] (Zugriff: 03.10.2023). 

3 OpenAl, „ChatGPT“, 2023, in [https://chat.openai.com] (Zugriff: 03.10.2023). 

4 Ryan Morrison, „OpenAl’s New Chatbot ChatGPT Could Be a Game-Changer for Businesses“, Tech 
Monitor, 2022, in [https:/techmonitor.ai/technology/ai-and-automation/chatgpt-openai-chatbot] (Zu- 
griff: 03.10.2023). Mubin Ul Haque et al., ,J think this is the most disruptive technology‘: Exploring 
Sentiments of ChatGPT Early Adopters using Twitter Data, arXiv 2022 (DOI: 10.48550/ar- 
Xiv.2212.05856). 

5 Steffen Albrecht, „TAB-Hintergrundpapier Nr. 26: ChatGPT und andere Computermodelle zur 
Sprachverarbeitung — Grundlagen, Anwendungspotenziale und mögliche Auswirkungen“, Karls- 
ruher Institut fiir Technologie-Bibliothek, 2023 (DOI: DOI: 10.5445/IR/1000158070); Laetitia Ramelet, 
„ChatGPT - Themenpapier: ChatGPT - wenn die künstliche Intelligenz schreibt wie ein Mensch. Und 
was es dabei zu beachten gilt“, TA-SWISS, 2023, in [https://www.ta-swiss.ch/chatgpt] (Zugriff: 03.10. 
2023); Europol, „ChatGPT- the Impact of Large Language Models on Law Enforcement“, a Tech Watch 
Flash Report from the Europol Innovation Lab, Publications Office of the European Union, Lu- 
xembourg, 2023, in [https://www.europol.europa.eu/publications-events/publications/chatgpt-impa 
ct-oFlarge-language-models-law-enforcement] (Zugriff: 03.10.2023). 
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2 Begriffe und Funktionsweise von 
KI-Textgeneratoren 


Zu den prominentesten Beispielen von KI-Textgeneratoren zählt ChatGPT, ein KI- 
Chatbot des Unternehmens OpenAl.° Ein Chatbot ist ein textbasiertes Dialogsystem, 
über das sich in natürlicher Sprache mit einem technischen System kommunizieren 
lässt. Herzstück solcher KI-Chatbots sind Sprachmodelle, sogenannte „Large 
Language Models“ (LLM). Derartige KI-Textgeneratoren basieren auf dem Maschi- 
nellen Lernen mit neuronalen Netzen, dem sogenannten Deep Learning. Die 
Sprachmodelle, sogenannte „Generative Pre-trained Transformer“ (GPT), werden 
anhand einer großen Anzahl von Texten vortrainiert.” 

Textgeneratoren wie ChatGPT arbeiten auf Grundlage von Wortfolgestatisti- 
ken,® d.h. sie berechnen ihre Ausgabe anhand der Wahrscheinlichkeit, mit der im 
zum Trainieren genutzten Textkorpus ein Wort auf das andere folgt. OpenAl nutzt 
zusätzlich das sogenannte bestärkende Lernen aus menschlichem Feedback 
(„Reinforcement Learning from Human Feedback“). Menschen bewerten die Aus- 
gaben des Chatbots und deren Feedback wird zum Feintuning des Modells genutzt. 

Linguistisch plausible Texte von Textgeneratoren beantworten Fragen somit 
nicht auf Grundlage von Semantik, Wissen oder ethischer Reflexion, sondern an- 
hand von Wahrscheinlichkeiten.’ Einige Autoren bezeichnen Sprachmodelle des- 
halb auch als „unreliable narrator [...] untethered to the truth“'° oder als „Stochastic 
Parrots“''. Die generierten Texte besitzen keine Faktentreue und können sogar frei 
erfundene Inhalte oder Quellen enthalten (sog. „Halluzinieren“'*). Da die Funkti- 
onsweise von Sprachmodellen und den darauf beruhenden Textgeneratoren nur 


6 OpenAI 2023; Mohammad Aljanabi/ChatGPT, „ChatGPT: Future Directions and Open possibilities“, 
Mesopotamian Journal of Cyber Security, 2023, 16-17 (DOI: 10.58496); Sascha Lobo, „ChatGPT: Das 
machtvollste Instrument, das je vom Menschen geschaffen wurde“, DER SPIEGEL, 2023, in [https:// 
tip.de/32pzj] (Zugriff: 03.10.2023). 

7 Morrison 2022. 

8 Vgl. hierzu Wolfram 2023. 

9 Viriya Taecharungroj, „What Can ChatGPT Do?‘ Analyzing Early Reactions to the Innovative AI 
Chatbot on Twitter“, Big Data and Cognitive Computing, Bd. 7, 2023 (DOI: 10.3390/bdcc7010035). 

10 Robert Dale, „GPT3: What's It Good for?“, Natural Language Engineering, Bd. 27, 2021, 113-118 
(DOI: 10.1017/S1351324920000601). 

11 Emily M. Bender et al., „On the Dangers of Stochastic Parrots: Can Language Models Be Too Big?“, 
FAccT ’21: Proceedings of the 2021 ACM Conference on Fairness, Accountability and Transparency, 
2021, 610-623 (DOI: 10.1145/3442188.3445922). 

12 Ziwei Ji et al., „Survey of Hallucination in Natural Language Generation“, ACM Computing 
Surveys, Bd. 55, 2023, 1-38 (DOI: 10.1145/3571730). 
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den wenigsten Anwendern bekannt sein dürfte, ist das Risiko groß, dass es zu fal- 
schen Erwartungen und Fehlnutzungen kommt. Dies kann dazu führen, dass die 
Ausgaben von Textgeneratoren falsch bewertet werden bzw. ihnen zu sehr vertraut 
wird. Deshalb wird insbesondere vor Anwendungen in sensiblen Feldern wie im 
Gesundheitsbereich oder im Finanzbereich gewarnt.'” Da Sprachmodelle auß- 
erdem mit einer großen Anzahl an Texten vortrainiert werden, die auch unausge- 
wogene, ethisch problematische oder gar falsche Aussagen beinhalten können, sind 
die Resultate grundsätzlich unter Vorbehalt zu rezipieren. So wurde insbesondere 
von Verzerrungen, Vorurteilen und rassistischen sowie sexistischen Bemerkungen 
durch das Sprachmodell GPT3 berichtet.'* 


3 Risikodimensionen 


Für einen verantwortungsvollen Umgang mit KI-Textgeneratoren ist es von großer 
Bedeutung zu verstehen, welche Risiken mit ihnen verbunden sind und ob ihr 
Einsatz gar Grund- und Menschenrechten gefährdet. Wir verstehen im Folgenden 
Risiko als Kombination der Wahrscheinlichkeit des Auftretens eines Schadens und 
der Schwere dieses Schadens, wobei eine Einzelperson, eine Vielzahl von Personen 
oder eine bestimmte Personengruppe beeinträchtigt werden kann (vgl. Artikel 3 (1) 
Nr. 1a und 1b des KI-Gesetzes).’° Da Risiken kontextabhängig sind, muss einerseits 
das Risiko durch die Art und Weise, wie diese Systeme konzipiert sind, andererseits 
aber auch die konkreten Anwendungen dieser Systeme betrachtet werden (Erwä- 
gungsgrund 58 a des KI-Gesetzes). Somit sind unterschiedliche Akteure im Le- 
benszyklus von generierten Inhalten zu berücksichtigen. Die Entwickler von 
Sprachmodellen, auch als Basismodelle bezeichnet, haben eine besondere Rolle, da 
sie für die Konzeption des Lern- oder Trainingsprozesses und die Auswahl der dafür 


13 Jon Christian, „Magazine Publishes Serious Errors in First Al-Generated Health Article“, Neo- 
scope, 2023, in [https:/futurism.com/neoscope/magazine-mens-journal-errors-ai-health-article]. 
(Zugriff: 13.09.2023). 

14 Luciano Floridi/Massimo Chiriatti, „GPT-3: Its Nature, Scope, Limits, and Consequences“, Minds 
and Machines, Bd. 4, 2020, 681-694 (DOI: 10.1007/s11023-020-09548-1); Dale 2021; Chris Stokel-Walker/ 
Richard Van Noorden, ,,What ChatGPT and Generative AI Mean for Science“, Nature, Bd. 614, 2023, 
214-216 (DOI: 10.1038/d41586-023-00340-6). 

15 Europäische Kommission, Vorschlag für eine Verordnung des Europäischen Parlaments und des 
Rates zur Festlegung harmonisierter Vorschriften für Künstliche Intelligenz (Gesetz über Künstliche 
Intelligenz) und zur Änderung bestimmter Rechtsakte der Union, Brüssel 2021, in [https://tip.de/yglrn] 
(Zugriff: 03.10.2023) in der Fassung der Abänderungen des Europäischen Parlaments vom 14. Juni 
2023 (COM(2021)0206 — C9-0146/2021-2021/0106(COD)), 2023, in [https:/www.europarl.europa.eu/do 
ceo/document/TA-9-2023-0236_DE.html] (Zugriff: 03.10.2023). 
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verwendeten Daten verantwortlich sind. Werden diese Basismodelle jedoch als 
Dienstleistung über einen entsprechenden Zugang an Betreiber weiterer KI-Syste- 
me bereitgestellt, zum Beispiel als Teil von Suchmaschinen, dann sind insbesondere 
die Betreiber dieser KI-Systeme für mögliche Folgen des generierten Outputs in die 
Pflicht zu nehmen. Denn es ist davon auszugehen, dass die Betreiber den spezifi- 
schen Verwendungskontext und die daraus resultierenden potentiellen Risiken 
besser kennen als die Entwickler der Modelle. Schließlich können die Nutzer dieser 
KI-Systeme die generierten Inhalte in sozialen Medien an weitere Empfänger ver- 
breiten und dadurch weitreichende systemische Risiken auslösen. 

Die Risiken von Textgeneratoren und Basismodellen umfassen im Allgemeinen 
finanzielle oder psychologische Folgen einer möglichen Diskriminierung oder 
Missachtung des Datenschutzes. Weiterhin sind neben den traditionellen „Safety- 
Risiken“ auch „Security“-Aspekte zu berücksichtigen, d.h. Risiken durch intentio- 
nale Bedrohungen und durch kriminellen Missbrauch.'® Aufgrund des breiten 
sektorübergreifenden Anwendungspotentials von Sprachmodellen sind deren 
mögliche Risiken jedoch nicht umfassend bekannt und abschätzbar. Im Folgenden 
wird in Anschluss an Luhmann eine Kategorisierung in drei verschiedenen Ebenen 
(Mikro-, Meso- und Makro-Ebene) vorgenommen.” Diese Risikoeinteilung wurde 
schon an anderer Stelle als hilfreiche Systematik zur Identifizierung vertrauens- 
bildender Maßnahmen digitaler Systeme angewendet." Dazu werden die Risiken 
für Individuen auf der Mikro-Ebene, die Risiken für Organisationen auf der Meso- 
Ebene und die gesamtgesellschaftlichen Risiken auf der Makro-Ebene betrachtet. 


3.1 Risiken auf individueller Ebene (Mikro-Ebene) 


In diese Dimension fallen Risiken durch die Verletzung von grundlegenden Rechten 
natürlicher Personen, also zum Beispiel von Persönlichkeitsrechten oder Daten- 
schutzrechten. Ein Schaden bezieht sich auf private Interessen und kann materi- 
eller oder immaterieller Art sein, einschließlich physischer oder psychischer 
Schäden. Aufgrund fehlenden Wissens über die Funktionsweise von Sprachmo- 
dellen besteht zunächst das Risiko, dass es zu falschen Erwartungen, Bewertungen 
und damit zu Fehlnutzungen derartiger Systeme kommen kann. So wird bei- 
spielsweise über einen Versuch in der Gesundheitsberatung berichtet, in dem das 


16 Terje Aven, „A unified framework for risk and vulnerability analysis covering both safety and 
security“, Reliability Engineering & System Safety, Bd. 6, 2007, 745-754 (DOI: 10.1016/j.ress.2006.03.008). 
17 Niklas Luhmann, Soziale Systeme. Grundrifs einer allgemeinen Theorie, Frankfurt a.M. 1984. 

18 Anna Hornik et al., „Die Zukunft des Vertrauens in digitale Welten. Studie Kurzfassung“, be- 
auftragt vom BMBF, 2022. 
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Sprachmodell GPT3 hochriskante Empfehlungen gab.’ Zu den Risiken, die sich aus 
dem Trainingsprozess von Sprachmodellen ergeben, zählen mögliche Diskrimi- 
nierungen von Personen oder Personengruppen. So konnten u.a. in einer Studie zu 
frühen Sprachmodellen implizite Vorurteile gegenüber Menschen mit Behinde- 
rungen aufgezeigt werden.” 

Weitere Risiken auf der individuellen Ebene ergeben sich durch die illegale 
Nutzung personenbezogener Daten ohne Erlaubnis der Betroffenen. Nutzer können 
außerdem selbst Datensicherheitsverletzungen verursachen, wenn diese bspw. 
durch Fragen und Aufforderungen im Chatverlauf (meist unwissentlich) perso- 
nenbezogene Daten preisgeben. Da Textgeneratoren auch zur Imitation eines spe- 
zifischen Sprachstils von Personen verwendet werden können, eignen sich die re- 
sultierenden Texte besonders effektiv zur Täuschung, für betrügerische und 
kriminelle Handlungen, Diskreditierungen sowie zur Beeinflussung menschlichen 
Verhaltens („Social Engineering“).”' 

Schließlich werden Textgeneratoren tiefgreifende Veränderungen der Arbeit 
von hochqualifizierten Berufsgruppen wie Programmierer:innen, Journalist:innen 
oder auch kreativ Tätigen auslésen.” Hier besteht das Risiko weniger in der voll- 
ständigen Verdrängung menschlicher Arbeit, sondern der Veränderung von Ar- 
beitsbedingungen durch zunehmenden Konkurrenzdruck, beschleunigte Arbeits- 
prozesse und wachsenden Stress.” 


3.2 Risiken auf Organisationsebene (Meso-Ebene) 


Zu dieser Risikodimension zählen insbesondere Sicherheitsrisiken und finanzielle 
Risiken für Unternehmen und Wirtschaft. Auch hier besteht das Risiko einer un- 
beabsichtigten Datensicherheitsverletzung durch die Preisgabe von Firmenge- 
heimnissen im Chatverlauf. Schulungen der Arbeitnehmer hinsichtlich einer 
kompetenten und rechtskonformen Anwendung sind unabdingbar. Es müssen dabei 


19 Ryan Daws, „Medical Chatbot Using OpenAl’s GPT3 Told a Fake Patient to Kill Themselves“, AI 
News, 2020, in [https://tip.de/afcv3] (Zugriff: 03.10.2023). 

20 Pranav Narayanan Venkit et al., „A Study of Implicit Bias in Pretrained Language Models against 
People with Disabilities“, ACL Anthology Proceedings of the 29th International Conference on 
Computational Linguistics, 2022, 1324-1332, in [https://aclanthology.org/2022.coling1.113] (Zugriff: 
03.10. 2023). 

21 Europol 2023. 

22 Tyna Eloundou et al., GPTs are GPTs: An Early Look at the Labor Market Impact Potential of Large 
Language Models, arXiv 2023 (DOI: 10.48550/arXiv.2303.10130). 

23 Patrick Dax, „Warum ChatGPT so schnell kein Job-Killer ist“, futurezone, 2023, in [https://tip.de/ 
jlShz] (Zugriff: 03.10.2023). 
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auch sicherheitsrelevante Strategien gegen mögliche böswillige Cyberangriffe, 
beispielsweise durch Manipulationen und Täuschungen mit nachgemachten 
Sprach- und Textstilen erlernt werden. Berücksichtigt man zusätzlich das steigende 
Ausmaß und die Geschwindigkeit der automatisierten Generierung irreführender 
Inhalte, erwarten Experten:innen insbesondere ein hohes finanzielles Risiko durch 
authentisch erscheinende Phishing-E-Mails und andere Betrugsfälle. Da Textgene- 
ratoren nicht nur zur Erstellung von Texten, sondern auch zur Generierung von 
Programm-Codes in der Softwareentwicklung eingesetzt werden, stellt sich die 
Frage, wie sich dies auf die Qualität von Softwareprodukten auswirkt.”* 

In einer Literaturstudie zu den Risiken von KI für Organisationen wurden 
neben konventionellen Angriffen völlig neuartige Bedrohungen wie Nutzerdaten- 
diebstahl und Angriff auf firmeneigene Trainingsdaten identifiziert. Insbesondere 
Sabotage und Spionage wurden als Angriffszwecke aufgeführt, die auch im Bereich 
der generativen KI relevant sein können.” Dabei ist zu berücksichtigen, dass nicht 
nur Unternehmen, sondern auch deren Personal und Kunden betroffen sein kön- 
nen. 


3.3 Risiken für die Gesellschaft (Makro-Ebene) 


Durch die Zunahme von authentisch wirkenden Texten wird das Risiko von Des- 
und Misinformation verstärkt und dadurch auch Schutzgüter von öffentlichem 
Interesse, wie der Schutz der Demokratie oder der Rechtsstaatlichkeit, gefährdet.”‘ 
Häufig genannte Beispiele sind der Missbrauch für Propagandazwecke, zur Mani- 
pulation von Wahlen oder zur Rekrutierung oder Finanzierung terroristischer 
Aktivitäten.” Da KI-Chatbots immer schwerer von Menschen zu unterscheiden 
sind, ist fraglich, ob und inwiefern eine unabhängige politische Willensbildung 
mittels ausgewogener Informationen überhaupt noch möglich ist. Weiterhin kann 
ein Bias in den für das Trainieren von Sprachmodellen verwendeten Datensätzen 
soziale Ungleichheiten verstärken oder einzelne Personengruppen diskriminieren. 
Da zu erwarten ist, dass sich generierte Inhalte immer mehr durchsetzen werden, 
ist eine zunehmende Standardisierung von Meinungen und Wissen sowie eine 
Erosion von kultureller und linguistischer Diversität zu befürchten. Letztlich kann 


24 Ramelet 2023. 

25 Yisroel Mirsky et al., The Threat of Offensive Al to Organizations, arXiv 2021, in [http://arxiv.org/ 
abs/2106.15764] (Zugriff: 03.10. 2023). 

26 Greg Noone, „This Is How GPT-4 Will Be Regulated“, TechMonitor, 2023, in [https://techmonitor.ai/ 
technology/ai-and-automation/this-is-how-gpt-4-will-be-regulate] (Zugriff: 03.10.2023). 
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auch eine Veränderung weiterer menschlicher Fähigkeiten wie Empathie oder so- 
ziale Kompetenz nicht ausgeschlossen werden, was weitreichende Auswirkungen 
auf die Art und Weise unseres Zusammenlebens haben könnte.”® 

Auf der Makro-Ebene ergeben sich auch ökologische Risiken, da die Entwick- 
lung und der Einsatz großer Sprachmodelle mit einem hohen Stromverbrauch 
verbunden ist.” Nur wenige marktbeherrschende BigTech-Unternehmen können 
außerdem die ökonomischen Voraussetzungen für die notwendigen Rechenleis- 
tungen aufbringen und dominieren zunehmend die gesellschaftlich relevante For- 
schung und Entwicklung von Sprachmodellen. 

Notwendige Regulierungsmaßnahmen stellen auf der Makro-Ebene eine be- 
sondere Herausforderung dar, da sie über den weitgehend individualrechtlichen 
Ansatz der rechtlichen Regulierung hinausgehen und gleichzeitig weitere Grund- 
rechte wie Meinungs- oder Kunstfreiheit abgewogen werden miissen.*° 


4 Regulierung 


Die mit der Anwendung von Sprachmodellen verbundenen mehrdimensionalen 
Risiken sollten durch adäquate Regulierungsmaßnahmen adressiert werden. Es 
existieren bereits unterschiedliche technikneutrale Regulierungsansätze auf EU 
und nationaler Ebene im zivilrechtlichen Bereich der Antidiskriminierung insbe- 
sondere nach Maßgabe der Europäischen Menschenrechtskonvention,®' im Bereich 
des Datenschutzes?” und des Urheberrechts,” aber auch durch das aktuelle Cy- 
bersicherheitsrecht.** Diese Regulierungen berücksichtigen überwiegend die Mi- 


28 Morrison 2022. 

29 David Patterson et al., Carbon Emissions and Large Neural Network Training, arXiv 2021 (DOI: 
10.48550/arXiv.2104.10350). 
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kro- und Meso-Ebene der Risiken durch Sprachmodelle, hinken aber der rapiden 
technologischen Entwicklung oft hinterher. Unklarheit besteht insbesondere bei der 
Anwendung des Urheberrechtes auf geschützte Trainingsdaten. Aktuell erfolgt in 
der EU auch ein Trilogprozess zur Entwicklung einer technikspezifischen Regulie- 
rung (Gesetz über Künstliche Intelligenz°°). In dem aktuellen Textentwurf des Eu- 
ropäischen Parlamentes werden Sprachmodelle oder Textgeneratoren unter den 
Begriffen „Basismodell“ und „Generative KI“ eingeführt. Da es bislang der einzige 
rechtliche Regulierungsansatz speziell zu Sprachmodellen und Textgeneratoren 
darstellt, wird dieses Gesetz im Folgenden detailliert betrachtet. 

Die EU-Kommission hat am 21. April 2021 den weltweit ersten Vorschlag eines 
Rechtsrahmens für KI vorgelegt. Seitdem hat das geplante Gesetz über KI das Ge- 
setzgebungsverfahren der EU weiter durchlaufen und Änderungen durch den Rat 
der EU und das Europäische Parlament erfahren. Insbesondere die am 14. Juni 2023 
verabschiedete Verhandlungsposition des Parlaments sieht wesentliche Änderun- 
gen am ursprünglichen Entwurf der Kommission vor.” Mit diesem Gesetz soll ein 
wirksames und verbindliches Regelwerk für KI-Systeme eingeführt werden. Die 
allgemeinen Grundsätze werden in Artikel 4a (1) des KI-Gesetzes aufgeführt und 
umfassen folgende Punkte: 

—  Menschliches Handeln und menschliche Aufsicht 
— Technische Robustheit und Sicherheit 

- Privatsphäre und Datenqualitatsmanagement 

— Transparenz 

- Vielfalt, Diskriminierungsfreiheit und Fairness 

- Soziales und ökologisches Wohlergehen. 


Gewählt wurde ein risikobasierter Ansatz, bei dem Art und Inhalt der Vorschriften 


auf die Intensität und den Umfang der Risiken zugeschnitten werden, die von KI-Systemen 
ausgehen können. Es ist daher notwendig, bestimmte unannehmbare Praktiken im Bereich der 
künstlichen Intelligenz zu verbieten und Anforderungen an Hochrisiko-KI-Systeme und Ver- 
pflichtungen für die betreffenden Akteure sowie Transparenzpflichten für bestimmte KI- 
Systeme festzulegen.” 


und über die Zertifizierung der Cybersicherheit von Informations- und Kommunikationstechnik und 
zur Aufhebung der Verordnung (EU) Nr. 526/2013 (Rechtsakt zur Cybersicherheit), 2019, in [http://data. 
europa.eu/eli/reg/2019/881/oj/deu] (Zugriff: 03.10.2023). 

35 Europäische Kommission, Gesetz über Künstliche Intelligenz, 2021. 

36 Die nachfolgenden Inhalte und Zitate beziehen sich, soweit nicht anders angegeben, allesamt auf 
den aktuellen Vorschlag des Europäischen Parlaments zum Gesetz über Künstliche Intelligenz, 2023. 
37 Erwägungsgrund 14 des KI-Gesetzes. 
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KI-Technologien werden im KI-Gesetz in unterschiedliche Risikoklassen eingeteilt 
und die vorgeschriebenen Maßnahmen und Verpflichtungen daran angeknüpft. Für 
bestimmte, in Anlage III des Gesetzes, näher spezifizierte Bereiche von sogenannten 
Hochrisikosystemen werden beispielsweise Konformitätsprüfungen notwendig. 

Große vortrainierte Sprachmodelle können als Basismodelle für unterschied- 
liche Zwecke eingesetzt werden. Das Risiko wird meist erst durch die konkrete 
Nutzung des Endverbrauchers bestimmt. Dieser dynamische Anwendungskontext 
erschwert die erforderliche Risikocharakterisierung und damit die Entscheidung, 
ob in einem spezifischen Fall ein sogenanntes Hochrisiko-KI-System vorliegt.°® 

Weiterhin gibt es im Trilog-Prozess eine Debatte zur Differenzierung zwischen 
„KI-Systemen mit allgemeinem Verwendungszweck (General Purpose AI)“ und 
„Basismodellen (Foundation Models)“. Der Begriff Basismodell umfasst hoch ent- 
wickelte KI-Modelle, einschließlich verschiedener generativer KI-Systeme wie 
ChatGPT, GPT-4, Bard oder Stable Diffusion (vgl. Artikel 3 (1) Nummer 1 c des KI- 
Gesetzes). Im Gegensatz dazu ist der vom Europäischen Rat im Dezember 2022 
eingeführte Begriff „Allzweck-KI-System“ unschärfer (vgl. Artikel 3 (1) Nummer 1 d 
des KI-Gesetzes). 

Ausschließlich Basismodelle sollen im Rahmen des KI-Gesetzes angemessenen 
und spezifischeren Anforderungen und Verpflichtungen unterliegen. 


Vortrainierte Modelle, die für eine enger gefasste, weniger allgemeine und begrenztere Reihe 
von Anwendungen entwickelt wurden und nicht an ein breites Spektrum von Aufgaben an- 
gepasst werden können, wie z.B. einfache Mehrzweck-KlI-Systeme, sollten für die Zwecke 
dieser Verordnung nicht als Basismodelle betrachtet werden, da sie besser interpretierbar sind 
und ihr Verhalten weniger unvorhersehbar ist.’ 


Der aktuelle Vorschlag für Basismodelle unterscheidet nun drei unterschiedliche 

Ebenen: 

— Mindeststandards für Entwickler von Basismodellen und eine zusätzliche 
Transparenzpflicht bezüglich des Einsatzes dieser Modelle in generativen KI- 
Systemen (Art. 28 b [4] in Verbindung mit Art. 52 [1] des KI-Gesetzes) 

- Spezifische Hochrisiko-Regeln für Anbieter, die das KI-System erheblich ver- 
ändern, dies gilt nur für generative KI-Modelle, die in konkreten Hochrisiko- 
Anwendungsfällen eingesetzt werden; 

- Regeln für die Zusammenarbeit entlang der KI-Wertschöpfungskette 


38 Natali Helberger/Nicholas Diakopoulos, „ChatGPT and the AI Act“, Internet Policy Review, Bd. 12, 
2023, in [https://policyreviewinfo/essay/chatgpt-and-ai-act] (Zugriff: 03.10.2023). 
39 Erwägungsgrund 60 g des KI-Gesetzes. 
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Zu den Mindeststandards der Basismodelle zählen beispielsweise Datenschutz, 
Nichtdiskriminierung, Energieeffizienz, Qualitätsmanagement oder Cybersicher- 
heitsverpflichtungen, die von den Entwicklern dieser Modelle umzusetzen sind, 
während die spezifischen Hochrisiko-Regeln für Anbieter und professionelle Nutzer 
gelten sollten. Das KI-Gesetz reguliert somit einerseits die Basismodelle per se an- 
hand von Mindeststandards, aber auch deren Kennzeichnung und Anwendung. 

In einer Stellungnahme zum gegenwärtigen Vorschlag wurde neben den 
Transparenzpflichten der Anbieter generativer Modelle auch Pflichten für Nutzer 
gegenüber den Empfängern vorgeschlagen, um die Verbreitung von Fake News und 
Fehlinformationen zu bekämpfen und derartige systemische Risiken aufzufangen.*° 
Das KI-Gesetz weist hinsichtlich gesellschaftlicher Risiken durch Misinformation 
auf die Wichtigkeit der Entwicklung von KI-Kompetenz hin; insbesondere sollen 
„die Anbieter und Nutzer von KI-Systemen in Zusammenarbeit mit allen einschla- 
gigen Interessenträgern die Entwicklung ausreichender KI-Kompetenzen bei Men- 
schen aller Altersgruppen, einschließlich Frauen und Mädchen, in allen Bereichen 
der Gesellschaft fördern“. Unter KI-Kompetenz werden alle Fähigkeiten und 
Kenntnisse verstanden, die es Anbietern, Nutzern und Betroffenen ermöglichen, 
„KI-Systeme in Kenntnis der Sachlage einzusetzen sowie sich der Chancen und Ri- 
siken von KI und möglicher Schäden, die sie verursachen kann, bewusst zu werden 
und dadurch ihre demokratische Kontrolle zu fördern.“ Eine weitere Konkreti- 
sierung erfolgt hier jedoch nicht. 

Zum Umgang mit Misinformation ist der Co-Regulierungsansatz zwischen 
staatlichen und nichtstaatlichen Akteuren im Bereich der Inhaltemoderation von 
Texten durch das Gesetz über Digitale Dienste** heranzuziehen. Dieses Gesetz ist 
ein prominentes Beispiel zur Regulierung der Verteilung von problematischen In- 
halten durch Plattformen mittels eines „Notice and Action“-Verfahrens: Plattformen 
sind nur dann von einer Haftung für rechtswidrige Inhalte freigestellt, solange sie 
davon keine Kenntnis haben oder nach Kenntniserlangung unverzüglich reagieren 
und die Inhalte entfernen. Sie werden allerdings nicht dazu verpflichtet, die Inhalte 


40 Philipp Hacker/Andreas Engel/Marco Mauer, „Regulating ChatGPT and Other Large Generative AI 
Models“, ACM Conference on Fairness, Accountability and Transparency, 2023, 1112-1123 (DOI: 10.1145/ 
3593013.3594067). Deutscher Bundestag, „Anhörung zum Thema ‚Generative Künstliche Intelligenz“, 
24.05.2023, in [https://tip.de/zmgrt] (Zugriff: 03.10.2023). 

41 Siehe Erwägungsgrund 9 b des KI-Gesetzes. 

42 Erwägungsgrund 9 b des KI-Gesetzes. 

43 Europäische Kommission, The Digital Services Act Package, 2021, in [https://digital-strategy.ec.eu 
ropa.eu/en/policies/digital-services-act-package] (Zugriff: 03.10. 2023); Conseil de Union européenne, 
Regulation (EU) ofthe European Parliament and ofthe Council on a Single Market For Digital Services 
(Digital Services Act) and amending Directive 2000/31/EC, 15.06. 2022, in [https://data.consilium.euro 
pa.eu/doc/document/ST-93422022-INIT/x/pdf] (Zugriff: 03.10.2023). 
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aktiv zu überwachen. Zusätzlich müssen die Betreiber sehr großer Plattformen (u.a. 
Facebook, Twitter) evaluieren, welche systemischen Risiken für Schutzgüter wie die 
Grundrechte der Nutzer oder für demokratische Wahlen von ihren Diensten aus- 
gehen, gegebenenfalls Gegenmaßnahmen ergreifen und darüber Bericht erstatten. 

Eine ähnliche Regelung zur Evaluierung von systemischen Risiken durch An- 
bieter von Sprachmodellen wird aktuell von mehreren Expert:innen gefordert. 
Unter den Anwendungsbereich des Gesetzes über Digitale Dienste fallen aus- 
schließlich sehr große Plattformen im Bereich der sozialen Medien, so dass zwar die 
Verteilung illegaler durch Menschen generierte Inhalte dem „Notice and Action“- 
Verfahren unterliegt. Die Risiken der mit Sprachmodellen generierten Texte per se 
bleiben aber unbeachtet. Um dieser Regelungslücke zu begegnen, ist vorgeschlagen 
worden, einige der Verpflichtungen des Gesetzes über Digitale Dienste auch auf die 
Entwickler generativer KI auszuweiten. Dabei käme ein analoger Melde- und Ak- 
tionsmechanismus nach dem Gesetz über Digitale Dienste in Frage (vgl. Artikel 16 
DSA). Die Nutzer von Sprachmodellen hätten dann die Möglichkeit, problematische 
Inhalte zu markieren und zu melden. Diese Meldungen könnten dann an die Ent- 
wickler und/oder Bereitsteller der Modelle weitergeleitet werden.** 

Neben der rechtlichen Regulierung unterziehen sich Entwickler großer 
Sprachmodelle, wie z.B. OpenAl, auch freiwilligen Selbstverpflichtungen.”” Hier 
werden u.a. Anforderungen für die Nutzung im Gesundheitsbereich, als Coaching 
und im Finanz- und Nachrichten-Bereich gestellt. Weiterhin beziehen sich Richtli- 
nien, Leitlinien und Verhaltenscodizes auf die Problematik systemischer Risiken auf 
der Makro-Ebene. Im Verhaltenscodex gegen Desinformation verpflichten sich 
unterzeichnende Unternehmen zu Maßnahmen gegen Desinformation.*® Hier 
werden insbesondere die Verbesserung der Medienkompetenz und Vertrauens- 
würdigkeit digitaler Inhalte und die Kooperation mit Faktenprüfer genannt. Die 
Unterzeichner sprechen sich für Instrumente zur Bewertung der Herkunft und 
Authentizität digitaler Inhalte durch Nutzer aus. Diese Instrumente und Maßnah- 
men sollen die Resilienz demokratischer Gesellschaften erhöhen. 

Die Risiken von Sprachmodellen bezüglich generierter Misinformation werden 
im Gegensatz zu den Risiken auf der Mikro- und Meso-Ebene aktuell hauptsächlich 
durch freiwillige Maßnahmen und Selbstverpflichtungen aufgefangen. Es ist unklar, 
ob diese Maßnahmen ausreichen oder eine rechtliche Regulierungslücke besteht. 


44 Philipp Hacker/Andreas Engel/Marco Mauer, Regulating ChatGPT and other Large Generative AI 
Models, arXiv 2023 (DOI: 10.48550/arXiv.2302.02337); Deutscher Bundestag 2023. 

45 Open AI 2023. 

46 Europäische Kommission, Strengthened Code of Practice on Disinformation, 2022, in [https://digi 
tal-strategy.ec.europa.eu/en/policies/code-practice-disinformation] (Zugriff: 03.10.2023). 
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5 Ausblick und Empfehlungen 


Durch die Anwendung von KI-Textgeneratoren kommen neue Fragen zur Zukunft 
unserer Kommunikation, unseres Arbeitens und unseres Zusammenlebens auf. Zur 
Beantwortung dieser Fragen benötigen wir ein breites und interdisziplinäres Ver- 
ständnis der Funktionsweise und der damit verbundenen komplexen Risiken durch 
Textgeneratoren. 

Gegenwärtig ist das rechtliche Umfeld rund um KI eher von Unsicherheit und 
Unklarheit geprägt. Die Regulierung von Textgeneratoren stellt zudem eine be- 
sondere Herausforderung dar, weil es eine Vielzahl von Akteuren im Lebenszyklus 
generierter Inhalte gibt. Neben den Entwicklern und Anbietern von Sprachmodel- 
len sind dies auch die Anwender von Sprachmodellen und Betreiber von Pro- 
grammen zur Textgenerierung, sowie die Nutzer der Textgeneratoren und die So- 
cial Media Plattformen, über die die generierten Inhalte verteilt werden können. 
Bei der Entwicklung geeigneter Maßnahmen sollte ein breites Spektrum von 
Stakeholdern einbezogen werden, um eine möglichst umfassende und ausgewogene 
Sichtweise zu gewährleisten, damit Risiken auf der Mikro-, Meso- und Makro-Ebene 
gleichermaßen berücksichtigt werden. 


Petra Gehring 

Rechtspolitische Bemessung möglicher 
gesellschaftlicher Gefahren digitaler 
Technologien? 


Zwei Gedankenexperimente mit anschließender Erwägung 


Abstract: ChatGPT was accepted as a fact by those with political responsibility. 
Generative AI suddenly „appeared“ and was discussed as an inevitable natural 
event. However, to what extent should one naturally accept that companies release 
newly developed digital products as a worldwide service without testing, without 
risk assessment, and also without the chance to prepare for any consequences? So 
far, there is no tradition of technology impact research for intellectual techniques 
(computing, reading, writing). Do people therefore mistakenly regard language 
technologies as harmless? This essay offers two thought experiments to illustrate 
this thesis. The deeper problem: Politics is evading responsibility here. 


1 Gedankenexperimente 


Stellen wir uns vor, ein US-amerikanisch-indischer Pharmakonzern namens Open 
Imagination — genauer: eine seiner Tochterfirmen, zuvor als nicht gewinnorien- 
tierte Forschungseinrichtung staatlich gefördert - hätte eine neuartige synthetische 
Droge auf den Markt gebracht. Die kleinen Tütchen mit dem weißen Pulver sind ein 
kostenfreies Angebot. Es handelte sich um eine frisch aus dem Forschungslabor zur 
Produktreife entwickelte, wohlschmeckende Substanz, die nach der Einnahme bei 
den Konsumentinnen und Konsumenten Wohlgefühl auslöst und über mehrere 
Stunden hinweg ihre Beredsamkeit enorm steigert: Die Leute formulieren auf 
einmal unglaublich schnell und sie drücken sich gut und differenziert aus, sogar in 
verschiedenen Sprachen — wobei ihnen dies allerdings nur gelingt, solange der 
Einfluss der Droge anhält. Sie lernen also nichts dazu, sie befinden sich lediglich 
temporär in einem veränderten Zustand. 

Die Droge scheint keine physischen Nebenwirkungen zu haben, auch wenn 
staatliche Tests dazu noch ausstehen. Allerdings beeinträchtigt die Droge den Ver- 
stand: Im Rausch halluzinieren diejenigen, die unter ihrem Einfluss stehen, auffällig 
oft wichtige Inhalte. Der Aussagengehalt der mündlichen und schriftlichen Pro- 
dukte der zu - angesichts fehlender Vorkenntnisse — fabelhafter Kreativität be- 
rauschten Mitbürger ist fehlerhaft. Die Leute sagen unsinnige Sachen und bemer- 


8 Open Access. © 2024 bei den Autorinnen und Autoren, publiziert von De Gruyter. Dieses Werk ist 
lizenziert unter einer Creative Commons Namensnennung - Nicht kommerziell - Keine Bearbeitung 4.0 International 
Lizenz. https:/doi.org/10.1515/9783111351490-022 
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ken es nicht. So schleichen sich etwa 20% schwer vorhersehbare Fehler ein. Man 
kann nicht verantworten, was man unter dem Einfluss der Droge äußert. Im Rausch 
Gesagtes, Geschriebenes, Getanes ist nur nach aufwendigen Kontrollen nutzbar. 

Dank bravouröser Logistik ist es Open Imagination gelungen, die neue Droge 
auf der ganzen Welt niedrigschwellig zugänglich zu machen. Die Behörden sind 
nicht vorgewarnt. Man findet die kleinen Tütchen ungefragt im Briefkasten, an 
Bushaltestellen und auf Supermarktparkplätzen stehen Automaten, die Zehnerpa- 
ckungen ausgeben. An Schulen und Hochschulen werden ganze Container ausge- 
liefert. Die jungen Leute nippen das Pulver wie Brause und lachen über den Unsinn, 
der ihnen über die Lippen kommt. 

Im Arbeitsleben wirft die neue „Produktivität“ der Berauschten Probleme auf, 
zumal schon die schiere Menge der oft sinnlosen Kommunikation den beruflichen 
Alltag sowie das öffentliche Leben stark verändert. Man wird somit misstrauischer, 
die Herkunft von textlichen (und auch anderen zeichenförmigen) Artefakten muss 
gekennzeichnet, geprüft und qualitätsgesichert werden. Die Alternative ist, Quatsch 
hinzunehmen. Was ebenfalls geschieht. Es sind ja nur Worte, sagen die einen, 
während die anderen warnen: Eine Gesellschaft, die ihre eigene Kommunikation zu 
verachten beginnt, muss autoritäre Mittel zur Ordnung des Zusammenlebens nut- 
zen. Die Frage stellt sich schon bei der Einnahme der Droge selbst. Denn eine 
Hauptschwierigkeit besteht darin, dass man die Menschen nicht davon abhalten 
kann, die Droge unentwegt zu sich zu nehmen - der Plapperzustand macht Freude, 
man genießt die eigene Kreativität. Warnende Stimmen sind unpopulär; Experten, 
die für mehr Fehlertoleranz werben, hört man hingegen gern zu. Das Bildungs- 
system kündigt an, künftig nur noch Hochbegabten (und gegen Entgelt) die Fähig- 
keit des fehlerfreien Schreibens im nüchternen Zustand vermitteln zu wollen. Po- 
litische Parteien beteuern, der anstehende Kulturwandel berge Chancen, man stelle 
die Versorgung mit der Droge daher sicher. Open Imagination verweist auf die 
enormen Umsätze, durch welche die Firma neue Märkte erschließe. Personen, die 
wirklich nüchtern bleiben wollen, gibt es bald kaum mehr - und so macht sich auch 
diesbezüglich ein neuartiges Vertrauensproblem breit: Als wer sprichst Du gerade? 
Weiß ich, dass Du meinst, was Du sagst? Sind wir unter dem Einfluss der Droge noch 
wir selbst? 

Noch ein zweites Gedankenexperiment. Stellen wir uns vor, der irisch-tibeti- 
sche Dienstleistungskonzern Open Infancy rollt - ohne dass die Möglichkeit von 
Derartigem zuvor auch nur von jemandem in Erwägung gezogen wäre - an einem 
einzigen, offenbar gut vorbereiteten, weltweit gleichen Stichtag im Spätsommer 
2024 ein neuartiges Dienstleistungsangebot aus. Es handelt sich um eine Art le- 
benslangen Escort-Service, den Kinder und Jugendliche (oder ihre Eltern) kostenlos 
buchen und fortan nutzen können. Ein hochgelehrter Mönch (oder auch eine 
Nonne) einer altruistischen Religion wird die Nutzer des Dienstes stets begleiten 
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und diesen die Beantwortung aller Wissensfragen wie auch alle Schreib- und For- 
mulierungsaufgaben abnehmen. Der Begleiter erledigt alles perfekt, agiert völlig 
neutral und uneigennützig — ja sogar weitsichtig und klug. Wer den Escort von Open 
Infancy bei sich hat, ist jeglicher eigenen Bildungsanstrengung enthoben und wird 
im Grunde sogar besser gestellt als nach den jahrelangen Mühen einer Schulzeit, die 
persönliche Leistung im Sinne einer eigenständig erbrachten Leistung fordert. 

Ein begleitetes Leben, selbst eingeschränkt, aber perfekt unterstützt, gewidmet 
also nur den Hobbys? Auch wenn Bildungsexperten Bedenken äußern, liegen die 
Vorteile des Angebotes nicht nur für die jugendlichen Interessenten auf der Hand. 
Die Nachfrage ist riesig und kann auch sofort befriedigt werden: Das Unternehmen 
hat tatsächlich ganze Legionen dieser dienstbaren Geister vorausschauend aufallen 
Weltkontinenten bereitgestellt. 

Anfängliche Befürchtungen, der Escort-Service könne im Alltag irgendwie stö- 
ren, lösen sich bald in Luft auf. Open Infancy hat seine Leute nicht nur gut geschult, 
sondern auch perfekt motiviert. Die Begleit-Mönche und -Nonnen erweisen sich als 
angenehm im Umgang, stets diskret, bedürfnisarm und erleben ihre Aufgabe - der 
sie sich freiwillig widmen, wie sie auf Nachfrage auch geduldig bestätigen - als in 
jeder Hinsicht erfüllend. 

Der Arbeitsmarkt begrüßt die Neuerung, denn Open Infancy wächst schnell und 
erbringt seine Dienste auch am Arbeitsplatz der so versorgten jungen Leute stabil; 
selbst freiwilliges Analphabetentum stört nicht mehr, da der neue Dienst die feh- 
lenden Kompetenzen mehr als ausgleicht. Zwar gilt es, zumindest dort, wo bei der 
Arbeit Wissen gefragt ist, Raum und Sitzplätze für das dienstbare Open Infancy- 
Personal vorzusehen. Auch Kantinen und Hotels erhöhen ihre Kapazitäten. Die 
gesteigerte Arbeitsproduktivität der für das Gehalt einer einzigen Person tätigen 
Open Infancy-Tandems wiegt solche Mehrkosten jedoch um ein Vielfaches auf. Der 
neue Dienst sorgt für einen nachhaltigen Wirtschaftsaufschwung auf der ganzen 
Welt. Auch die Einsparungen im Bildungssystem sind eklatant. 

Warnungen, hin und wieder würden Gewalthandlungen von Ol-Jugendlichen 
gegen ihre Escort-Person vermeldet, der neue Dienst könne überhaupt den sozialen 
Frieden gefährden, stufen Sicherheitspolitiker als übertriebene Befürchtung ein. 
Auch Open Infancy selbst teilt mit, man tue alles, um den von ihren Angestellten 
begleiteten Personen den Alltag so angenehm wie möglich zu gestalten — und dies 
wirklich ein Leben lang. 


2 Erwägungen 


Was ist das Gemeinsame dieser Gedankenexperimente? Natürlich, dass sie schon 
deshalb unrealistisch sind, weil in beiden Fällen nationalstaatliche Behörden ein- 
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greifen würden. Medikamente bedürfen einer Zulassung; man darf nicht einfach 
Drogen auf den Markt bringen. Und gerade psychogene Substanzen stehen unter 
besonderem Verdacht - nicht nur eine Gefahr für den Körper, sondern auch für die 
öffentliche Sicherheit zu sein. Ähnliches gilt für die Abschaffung des Bildungsge- 
dankens und den faktischen Verzicht auf eine Schulpflicht für große Teile der Ju- 
gend. Gleichheit aller und maximaler Kompetenzerwerb sind jedenfalls in den 
Verfassungen der meisten Länder fest verankerte Güter. Die Vorstellung, eine Firma 
könnte einen — noch dazu derart perfekten — Entmündigungsdienst global eta- 
blieren kann, würde nicht nur durch heftige kritische Diskussionen, sondern auch 
durch ein Einschreiten von Gerichten und Behörden verhindert. Auch Sektenbe- 
auftragte und Menschenrechtsvereinigungen würden Sturm laufen, da Open In- 
fancy Abhängigkeiten schafft und auch offenkundig diskriminiert. Ob der Dienst je 
eine Zulassung für sein Geschäftsmodell erhalten würde, stünde dahin. 

Als der US-amerikanische, vermeintlich nicht gewinnorientierte Konzern Open 
AI im Spätherbst 2022 seinen weltweit zugänglichen Chatbot ChatGPT freischaltet, 
befindet sich die Welt einige Tage im Schock. Man spricht von einer Revolution, der 
Dienst wird in kürzester Zeit von mehr Menschen erprobt als je ein anderes An- 
gebot im Internet. Urheberschaft, Authentizität sowie die Erkennbarkeit und auch 
Richtigkeit der maschinengenerierten Text-Artefakte — oder eigentlich: der Hy- 
bridprodukte, die menschliche Nutzerinnen und Nutzer mittels des Bots erstellen — 
sprengen unsere überkommenen Gewissheiten dessen, wie wir „Sprache“ im Alltag 
Menschen zurechnen können. Ebenso entsteht sehr viel gut verpackter Unsinn, da 
das von Open AI kreierte System irreführend schlüssig klingende Sprachteppiche 
erzeugt, deren Gehalt — also Botschaften - jedoch weder ein Verstand noch ein 
Fakten-Check absichert. Die eigentliche Leistung der auf ein Gesamtsprachmodell 
aufsetzenden Software ist von daher die Simulation oder aber die Nachahmung von 
sprachlichem Sinn. Prüfen und als Maschinenprodukt kennzeichnen lassen sich die 
Texte aufgrund ihrer linguistischen Qualität gleichwohl nicht. Im Gegenteil lässt 
sich das System sogar zur gezielten Imitation beispielsweise eines individuellen 
Sprachstils einsetzen, was seine im Kern simulative Leistungsfähigkeit verstärkt. 

Sinnsimulatoren, die bis zu 80% treffsicher „richtige“ Sätze aneinanderfügen: 
Auch das berührt einen Grundbestand der gesellschaftlichen Ordnung. Dennoch 
werden „Risiken“ entweder gar nicht oder in absurder Weise — ob hier eine über- 
menschliche Intelligenz entstünde - diskutiert. Lediglich Italien hat das Angebot für 
einige Tage blockiert. Der einsetzende Diskurs über „Chancen“ der neuen Techno- 
logie sowie der Wettbewerb darum, zu den Anbietern vergleichbar erfolgreicher 
Sprachdienste zu gehören, übertönt nicht nur die Bedenken äußernden Stimmen, 
sondern lässt selbst den Gedanken, sich erst einmal Zeit für ein technology as- 
sessment zu nehmen, gar nicht aufkommen. Anders gesagt lassen sich die Regie- 
rungen weltweit auf ein Realexperiment ein. Generative KI ist „da“ und wird - 
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politisch - in der Art eines Naturereignisses akzeptiert. Sollte die neue Technologie 
Gefahren bergen, sind die Technikfolgen irreversibel. 

Es gibt in Deutschland mehrere Bundesbehörden, die der Verträglichkeit und 
dem Nutzen von Lebensmitteln und Drogen nachgehen, bevor diese eine Markt- 
zulassung erhalten, unter anderem ein Institut für Arzneimittelzulassung (BfArM). 
Entsprechend schwer haben es neue Substanzen. Ebenso würde die Vereinbarkeit 
von bildungsersetzenden Begleitdiensten, ließe eine Regierung sie schlichtweg ge- 
währen, sofort von Gerichten geprüft und mit großer Sicherheit gestoppt werden. 
Gewerkschaften, Bildungseinrichtungen und Massenmedien würden die Sache 
nicht als technologische Neuerung loben, sondern eine Antidiskriminierungskam- 
pagne starten. 

Ein Bundesamt, das Sprachtechnologien — oder allgemeiner gesprochen: die 
disruptiven und potenziell zerstörerischen Folgen neuer Intellektualtechnologien — 
prüft, gibt es nicht. Dabei hat man in den letzten Jahren die massiven Schäden 
erlebt, die das durch Desinformation und Hass zunehmend toxische halbprivate 
Internet (also „Soziale Medien“) Gesellschaften, Öffentlichkeiten wie auch Einzel- 
personen zufügt. Bürgerinnen und Bürgern, für welche Politik Verantwortung trägt, 
werden vor den Auswirkungen automatisierter Digitalkommunikation nicht ge- 
schützt. Open AI konnte seinen Dienst freischalten, und es wurden hinsichtlich der 
Folgen seiner massenhaften Nutzung noch nicht einmal prüfende (geschweige denn 
vorsorgliche) Vorkehrungen getroffen. 

Selbst neue Computerspiele unterliegen in Deutschland einer strengeren Re- 
gulierung: Nur Volljährige dürfen sie nutzen, wenn sie sich nicht der Selbstkontrolle 
der Spieleindustrie unterwerfen, und die Bundesprüfstelle für jugendgefährdende 
Medien kann sie indizieren. Inzwischen zeichnet sich ab, dass auch die EU gene- 
rative Sprach-KI nicht als Fall einer Risikoanwendung von künstlicher Intelligenz 
bewerten wird. Auch hier scheint man die Risiken, um die sich Rechtspolitik 
kümmert, auf das Leitbild „physischer“ Gefahren zu beschränken. Müssen sich 
nicht aber mögliche gesellschaftliche Gefahren digitaler Sprachtechnologien von 
vornherein ganz anders bemessen? 


VI Sprache, Wahrheit und Kommunikation 


Constanze Spieß 

Keine Panik vor der KI - 
Zuschreibungshandlungen in Diskursen 
über Künstliche Intelligenz 
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Abstract: In public-political discourses, there has been a more or less intensive 
debate on Artificial Intelligence since the mid-1960s; current technological innova- 
tions are giving rise to an intense discourse about the pros and cons, risks, and 
opportunities of Artificial Intelligence (AI). The linguistic phenomena in this dis- 
course provide insights into how we construct AI, what image we have of it, what 
abilities are attributed to it, and what notions are associated with AI, both positively 
and negatively. The article focuses particularly on attributions, metaphors, and 
argumentation patterns. 


1 Einführung 


Künstliche Intelligenz stellt eine gesellschaftlich umstrittene technologische Inno- 
vation dar, deren Potenziale zum einen als große Chance, zum anderen aber auch 
als Gefahr für die Menschheit konzeptualisiert werden. Künstliche Intelligenz (KI) 
wird im öffentlichen Diskurs nicht nur als Schlüsseltechnologie diskutiert, der 
Ausdruck Künstliche Intelligenz selbst hat sich zu einem Schlüsselwort im Diskurs 
etabliert, mit dem verschiedene Vorstellungen über Künstliche Intelligenz ver- 
bunden werden. Diese Vorstellungen werden sprachlich konstituiert. Dabei ist der 
Ausdruck Künstliche Intelligenz nicht neu. 

In medialen Debatten wurde er bereits in den 1960er Jahren eingeführt und im 
Deutschen Bundestag wurde erstmals 1984 über Formen Künstlicher Intelligenz 
debattiert. 

Neu an der aktuellen Situation ist aber, dass sich Künstliche Intelligenz in einer 
rasanten Geschwindigkeit zu entwickeln scheint. Diese rasche Entwicklung hat 
Auswirkungen auf die Art und Weise, wie über die Technologie im öffentlichen 
Diskurs gesprochen wird. 

Der vorliegende Beitrag befasst sich mit einem Ausschnitt aus dem öffentlichen 
Diskurs über Künstliche Intelligenz. Es wird untersucht, mit welchen sprachlichen 
Mitteln über Künstliche Intelligenz gesprochen wird und welche kommunikativen 
Funktionen mit den je verschiedenen sprachlichen Konstitutionen im 6ffentlich- 


8 Open Access. © 2024 bei den Autorinnen und Autoren, publiziert von De Gruyter. Dieses Werk ist 
lizenziert unter einer Creative Commons Namensnennung - Nicht kommerziell - Keine Bearbeitung 4.0 International 
Lizenz. https:/doi.org/10.1515/9783111351490-023 
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politischen Diskurs realisiert werden. Dabei spielen Zuschreibungshandlungen eine 
zentrale Rolle. Ausgangspunkt und Grundlage des Beitrags bildet eine handlungs- 
orientierte Auffassung von Sprache, die im folgenden Abschnitt zunächst erörtert 
wird. In einem weiteren Schritt wird der Zusammenhang zwischen sprachlicher 
Handlung und Diskursen als Bedingungsmöglichkeiten für das Sprechen über KI 
erläutert, um im Anschluss daran das Konzept der Zuschreibungen als Teil von 
Stancetaking-Aktivitäten vorzustellen. Abschnitt 5 geht auf wichtige Befunde der 
empirischen Analyse ein. Ein Resümee beschließt den Beitrag. 


2 Sprachliches Handeln - Bestimmungsstücke 


Gegenstand des Beitrags ist die Frage nach der Art und Weise, wie KI in Diskursen 
sprachlich konstituiert wird. Grundlage ist demnach eine konstruktivistische Per- 
spektive, die zudem davon ausgeht, dass Sprechen (soziales) Handeln ist. Wie aber 
ist ein solcher pragmalinguistischer Begriff sprachlichen Handelns näherhin zu 
beschreiben? 

Durch sprachliches Handeln wird Welt konstruiert." Sprachliches Handeln ist 
dabei durch vier Bestimmungsstücke gekennzeichnet: Leiblichkeit, Sozialität, Zeit- 
lichkeit und Epistemizität. Zum einen ist sprachliches Handeln immer schon ge- 
bunden an körperliche Tätigkeit. Deppermann spricht von „verkörperter Praktik“”, 
denn der Körper ist beteiligt beim Sprechen, Lesen, Schreiben. Zudem ist sprach- 
liches Handeln häufig gekennzeichnet durch Multimodalität, insofern als Sprechen/ 
Schreiben mit anderen semiotischen Modalitäten in situierten Kontexten koordi- 
niert wird und in übergeordnete Praktiken integriert ist, was Deppermann als 
„umfassende praxeologische Einbettung des sprachlichen Handelns“? beschreibt. 

Das Soziale ist Bedingungsmöglichkeit und „Konstitutionsgrund sprachlicher 
Praxis“*. Sprachliches Handeln findet in intersubjektiven, interpersonellen Struk- 
turen statt, ist beeinflusst durch soziale, institutionell und kulturell geprägte Zwecke 
der an der sprachlichen Interaktion Teilnehmenden sowohl auf der Mikroebene 
wie auch auf der Makroebene. Die Bedeutung von sprachlichen Handlungen wird 


1 Vgl. Peter Berger/Thomas Luckmann, Die gesellschaftliche Konstruktion der Wirklichkeit. Eine 
Theorie der Wissenssoziologie, Frankfurt a. M. 7°2004. 

2 Arnulf Deppermann, „Pragmatik revisited“, in Sprachwissenschaft im Fokus. Positionsbestim- 
mungen und Perspektiven, hg. von Ludwig Eichinger, Berlin/Boston 2015a, 328. 

3 Ebd., 330. 

4 Ebd., 335; vgl. Constanze Spieß, „Die sprachlich-diskursive Konstitution von Weltanschauung und 
Weltbild im Stammzelldiskurs durch Lexik, Metaphorik und Argumentationsmuster“, tekst i dys- 
kurs — Text und Diskurs, Bd. 4, 2011b, 70-72. 
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demzufolge sozial konstituiert, die soziale Konstitution erfolgt dabei prozessual und 
wechselseitig, u.a. durch Zuschreibungshandlungen der beteiligten Diskursakteur: 
innen (s. Abschnitt 4 in diesem Beitrag)”. 

Sprachliches Handeln hat immer schon eine zeitliche Dimension, insofern es — 
ob mündlich oder schriftlich — prozessual erfolgt. Es ist sequenziell (in der Münd- 
lichkeit) und seriell (in der Schriftlichkeit) organisiert, simultan mit anderen 
Handlungsressourcen verknüpft, zugleich aber retrospektiv und projektiv ausge- 
richtet. Sprachliches Handeln ist demzufolge eingebunden in historische Kontexte, 
sprachlich Handelnde nehmen im gegenwärtigen Handlungsvollzug Bezug auf 
Vergangenes und entwerfen Zukünftiges bzw. stellen die Bedingungen für zukünf- 
tige sprachliche Handlungen dar. Deutlich wird das beispielsweise an den sprach- 
lichen Belegen 9, 12 und 13 (s.u.), die unter Rückgriff auf Vergangenes, Bezug auf die 
Gegenwart und die Zukunft nehmen. Der sprachliche Bezug auf rasante technolo- 
gische Entwicklungen bezieht sich unter Verweis auf die aktuelle Situation auf 
zukünftiges Handeln und macht dadurch ein „Anschlusshandeln erwartbar“®. 

Sprachliches Handeln ist durch praktisch-soziokognitive Prozesse von Auf- 
merksamkeitskoordination, Perspektivübernahme oder -verweigerung, durch In- 
tentionszuschreibungen und die Rezeption von Intentionen gekennzeichnet. In der 
Interaktion wird auf Wissensbestände rekurriert und Wissensbestände werden 
dadurch aktiviert. Wir agieren auf der Basis des geteilten Wissens, das vor dem 
Hintergrund der Beteiligungsstruktur und der damit verbundenen Adressat:in- 
nenorientierung aktiviert und dabei auch modifiziert wird. Zuschreibungen von 
Handlungen und Eigenschaften erfolgen vor diesem Hintergrund. 

Dies gilt es bei der Rezeption von Kommunikaten und deren Analyse im Hin- 
blick auf sprachliche Phänomene der Konstitution von KI zu beachten. Da sprach- 
liches Handeln immer schon situativ verortet und auf Kontexte angewiesen ist, 


5 In gesprächslinguistischen Arbeiten spricht man von der Beteiligtenstruktur bzw. dem recipient 
design. „By ‚recipient design‘ we refer to a multitude of respects in which the talk by a party ina 
conversation is constructed or designed in ways which display an orientation and sensitivity to the 
particular other(s) who are the co-participants. In our work, we have found recipient design to 
operate with regard to word selection, topic selection, admissibility and ordering of sequences, 
options and obligations for starting and terminating conversations, etc.[...].“, Harvey Sacks et al., „A 
simplest systematics for the organization of turn-taking for conversations“, Language, Bd. 50(4), 1974, 
727. In diskurslinguistisch orientierten Arbeiten wurde der von Kühn geprägte Begriff der Adressat: 
innenorientierung eingeführt, wobei die Adressat:innenorientierung m.E. zu kurz greift, da nur die 
Perspektive der Sprechenden und nicht aller an der Interaktion Beteiligten in den Blick genommen 
wird. Siehe hierzu: Peter Kühn, Mehrfachadressierung. Untersuchung zur adressatenspezifischen 
Polyvalenz sprachlichen Handelns, Tübingen 1995. Es spricht somit nichts dagegen, das Konzept der 
Beteiligtenstruktur auf überindividuelle Diskurse anzuwenden. 

6 Deppermann 2015a, 334. 
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zugleich aber Kontexte hervorbringt, muss davon ausgegangen werden, dass 
sprachliches Handeln immer schon in Diskurse eingebunden ist und Diskurse Be- 
dingungsmöglichkeiten sprachlichen Handelns darstellen. 


3 Diskurse als Bedingungsmoglichkeiten 


Diskurse werden in einer linguistischen Perspektive als Ansammlungen von Aus- 
sagen, Äußerungen, Texten, Gesprächen, kommunikativen Formaten zu einem 
Thema aufgefasst, die durch die Merkmale der Serialität, Prozessualität, Dynamik, 
Kontextualität, Gesellschaftlichkeit, Öffentlichkeit, Medialität, Intertextualität be- 
stimmt und geprägt sind.’ 

Diskurse sind in diesem Zusammenhang und im Anschluss an Foucault als 
Formationen von Wissen aufzufassen, innerhalb derer Wissen musterhaft und 
seriell erscheint sowie prozessiert wird; getragen werden Diskurse durch kom- 
munikative Aktivitäten unterschiedlicher Formen. Foucault definiert Diskurse als 
Formationssysteme von Wissen: 


Unter Formationssystem muß man also ein komplexes Bündel von Beziehungen verstehen, die 
als Regel funktionieren: Es schreibt das vor, was in einer diskursiven Praxis in Beziehung 
gesetzt werden mußte, damit diese sich auf dieses oder jenes Objekt bezieht, damit sie diese 
oder jene Äußerung zum Zuge bringt, damit sie diesen oder jenen Begriff benutzt, damit sie 
diese oder jene Strategie organisiert. Ein Formationssystem in seiner besonderen Individua- 
lität zu definieren, heißt also, einen Diskurs oder eine Gruppe von Aussagen durch die Re- 
gelmäßigkeit einer Praxis zu charakterisieren. 


Formationen von Wissen werden folglich dynamisch prozessiert. Für das Sprechen 
über KI bedeutet das, dass die Konstitution von KI und damit verbundene Fragen, wie 
wir uns KI vorstellen, was KI für uns darstellt und bedeutet, nicht abgeschlossen sind. 

Diskurse stellen aus einer linguistischen Perspektive dabei Ensembles von 
Äußerungen zu einem spezifischen Thema dar. Die einzelnen Äußerungen sind in 
größere Zusammenhänge eingebettet und thematisch vernetzt,’ wobei die Äuße- 
rungen sich aus einem Zusammenspiel unterschiedlicher Modalitäten begründen 
können (klassisch und häufig z.B. durch Text-Bild-Gefüge). 


7 Vgl. hierzu Constanze Spieß, Diskurshandlungen. Theorie und Methode linguistischer Diskurs- 
analyse am Beispiel der Bioethikdebatte, Berlin/Boston 2011a. 

8 Michel Foucault, Archäologie des Wissens, Frankfurt a.M. 1981, 108. 

9 Vgl. Dietrich Busse/Wolfgang Teubert, „Ist Diskurs ein sprachwissenschaftliches Objekt? Metho- 
denfrage der historischen Semantik“, in Begriffsgeschichte und Diskursgeschichte. Methodenfragen 
und Forschungsergebnisse der historischen Semantik, hg. von Dietrich Busse, Opladen 1994, 10-28. 
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Diskurslinguistische Ansätze stellen zumindest zwei Fragen: Wie wird dieses 
wertende Wissen tiber KI in Form von Positionierungen und Stancetaking-Aktivitaten, 
die u.a. als Zuschreibungen von Eigenschaften und Handlungen formuliert werden 
und in komplexe Argumentationen eingebettet sind, in den hier untersuchten Dis- 
kurstexten sprachlich hervorgebracht, im Diskurs sedimentiert und/oder kolportiert? 
Welche konkreten sprachlichen Ebenen und damit verbundenen sprachlichen Pha- 
nomene spielen dabei eine zentrale Rolle und werden innerhalb von kommunikati- 
ven Praktiken,'” die Elemente von Diskursen sind, diskursiv erzeugt? 


4 Zuschreibungshandlungen 


Über Zuschreibungshandlungen werden in Diskursen Sachverhalte, Gegenstände, 
Ideen und Konzepte konstituiert und diskursiv verhandelt. Mit der Zuschreibung 
findet zugleich eine Bewertung des Gegenstands, des Sachverhalts, der Idee oder des 
Konzepts statt sowie eine Positionierung zum entsprechenden Gegenstand etc. Ein 
Konzept, mittels dessen Zuschreibungshandlungen theoretisiert werden können, 
stellt das Stancetaking-Konzept im Anschluss an Dubois 2007 dar. Zuschreibungs- 
handlungen sind dabei Ausprägungen von Positionierungshandlungen, welche im 
Komplex der Stancetaking-Aktivität zu erörtern sind.'' Stancetaking und Positio- 
nierung sind diskursive Aktivitäten, die sprachliche Handlungen konstituieren und 
die durch sprachliche Handlungen zur Geltung kommen. Da sprachliches Handeln 
immer schon aus einer bestimmten Perspektive erfolgt, sind Stancetaking-Aktivi- 
täten in jeglichen kommunikativen Akten mehr oder weniger deutlich integriert; 
Sachverhalte/Konzepte/ Handlungen werden mehr oder weniger stark in den ver- 
schiedensten kommunikativen Praktiken durch Stellung beziehende Akte bewertet. 
So auch beim Sprechen über KI. Du Bois beschreibt den Akt des Stancetaking, als 
„[to] evaluate something, and thereby position myself, and thereby align with 
you.“'?, Akte des Stancetaking umfassen im Wesentlichen drei Aspekte: 

a) den Aspekt der Bewertung von Sachverhalten, Gegenständen, Objekten, Ideen, 

Handlungen usw. 


10 Zum Konzept der kommunikativen Praktiken vgl. Arnulf Deppermann/Helmuth Feilke/Angelika 
Linke, „Sprachliche und kommunikative Praktiken: Eine Annäherung aus linguistischer Sicht“, in 
Sprachliche und kommunikative Praktiken, hg. von dens., Berlin/Boston 2016. Der Begriff der Prak- 
tiken umfasst auch die sprachlichen Handlungen, die in soziale Praktiken (zu denen die kommu- 
nikativen Praktiken zählen) eingebettet sind. 

11 Vgl. hierzu John Du Bois, „The Stance triangle“, in Stancetaking in discourse Subjectivity, eva- 
luation, interaction, hg. von Robert Englebretson, Amsterdam 2007. 

12 Ebd., 163. 
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b) den Aspekt der Positionierung der Akteure zum Sachverhalt, Gegenstand, Ob- 
jekt, zur Idee bzw. Handlung usw. und zugleich 
c) die Ausrichtung der Akteure untereinander. 


Die Bewertung von Sachverhalten, Gegenständen, Objekten, Ideen und Handlungen, 
die Positionierung von Diskursakteur:innen dazu sowie die Ausrichtung der Akteur: 
innen untereinander kann dabei explizit oder implizit erfolgen. Implizit zeigt sich 
dies u.a. durch den Sprachgebrauch, beispielsweise durch gruppenspezifisches 
Vokabular oder in der Argumentation durch Widerlegung oder Bestätigung von 
Argumenten oder aber in der Verwendung von Metaphern. Ohne Bezug auf 
Stancetaking haben sich Lucius Hoene/Deppermann mit der sprachlichen Aktivität 
der Positionierung auseinandergesetzt. Sie verstehen darunter „zunächst ganz all- 
gemein die diskursiven Praktiken, mit denen Menschen sich selbst- und andere in 
sprachlichen Interaktionen aufeinander bezogen als Personen her- und darstellen, 
welche Attribute, Rollen, Eigenschaften und Motive sie mit ihren Handlungen in 
Anspruch nehmen und zuschreiben, die ihrerseits funktional für die lokale Iden- 
titätsher- und -darstellung im Gespräch sind [...].“"® 

Im vorliegenden Beitrag wird unter Positionierungen, die immer schon im 
Kontext von Stancetaking-Aktivitäten erfolgen, eine ideologisch'* gebundene Akti- 
vität der Zuschreibung von Attributen, Eigenschaften, Verhaltensweisen als Formen 
der Bewertung von Sachverhalten verstanden. 

Bei Stancetakingaktivitäten nehmen die Akteure durch sprachliche Mittel Be- 
zug aufeinander, insofern sie sich durch den Sprachgebrauch entweder abgrenzen 
oder bestimmte Ausdrucksphänomene affirmativ verwenden. Die Akteure bewer- 
ten mittels Sprachgebrauch einen Sachverhalt/eine Idee/ein Objekt/eine soziale 
Gruppe/eine Person etc. und positionieren sich mit dem Sprachgebrauch zu den 
jeweiligen Akteur*innen. Dabei werden sowohl durch Abgrenzungs- als auch durch 
Affirmationshandlungen zugleich die Gegenstände im Diskurs hervorgebracht. 

Es lässt sich also festhalten, dass Stancetaking- und Positionierungsaktivitäten 
von Akteuren in Diskursen realisiert werden. Sie stellen sprachliche Handlungen 
dar, die Bezug nehmen auf Vergangenes und Zukünftiges hervorbringen, sie sind 


13 Gabriele Lucius-Hoene/Arnulf Deppermann, „Narrative Identität und Positionierung“, Ge- 
sprächsforschung — Online-Zeitschrift zur verbalen Interaktion, Bd. 5, 2004, 168, in [http://gespraechs 
forschung-online.de/heft2004/ga-lucius.pdf] (Zugriff: 18.10.2023). 

14 Zum hier verwendeten Begriff der Ideologie, der an Valentin N. VoloSinov, „Marxismus und 
Sprachphilosophie. Grundlegende Probleme der soziologischen Methode in der Sprachwissen- 
schaft“, hg. und mit einer Einleitung versehen von Samuel M. Weber, Berlin/Frankfurt a.M. 1975, 
sowie an Karl Mannheim, Ideologie und Utopie, Frankfurt a. M. °2015 anschließt, vgl. Spieß 2011a und 
Spieß 2011b. 
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eingebunden in situierte Kontexte, zugleich bringen sie Kontexte hervor. Stanceta- 
king- und Positionierungsaktivitaten sind somit als dynamische, interaktive Formen 
der Einstellungs- und Bewertungsbekundung aufzufassen. 

Du Bois hat zur Veranschaulichung von Stancetakingaktivitäten ein Stance- 
dreieck entwickelt (Abb. 1). 


Akteur 1 


Objekt/Sachverhalt 


< richtet sich aus p 


Akteur 2 


Abbildung 1: Stancedreieck."° 


Bezieht man nun den Sprachgebrauch in das Modell mit ein, ergibt sich folgendes 
modifiziertes Stancedreieck (Abb. 2). 


Akteur 1 


> 


Objekt/ mmm» spezifischer 
Sachverhalt Sprachgebrauch 


richtet sich aus 
positioniert sich 


<< bewertet 


Akteur 2- Akteur n 


Abbildung 2: Modifiziertes Stancedreieck im Anschluss an Du Bois."° 


15 Du Bois 2007, 163. 

16 Vgl. auch Constanze Spieß, „Stancetaking- und Positionierungsaktivitäten im öffentlichen Me- 
tasprachdiskurs über jugendliche Sprechweisen. Eine Analyse von User*innen-Kommentaren im 
Web“, in Jugendsprachen/Youth Languages hg. von Arne Ziegler, Berlin/Boston 2018. 
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Zusammenfassend lässt sich also festhalten, dass Sprache eine zentrale Rolle 
bei der Etablierung von Vorstellungen über die Künstliche Intelligenz spielt. Welche 
sprachlichen Mittel genutzt werden, um KI im Diskurs zu konstituieren, soll im 
folgenden Abschnitt präsentiert werden. 


5 Befunde einer Pilotstudie 


Der vorliegende Beitrag versteht sich als qualitative Pilotstudie. Es wurden für den 
Zeitraum von 2019 bis 2023 ca. 40 Texte (22 Medientexte aus Debattenreihen der SZ 
und 16 Debattenreden aus der 42. Sitzung des Bundestages in der 19. Wahlperiode, 
Tagesordnungspunkt 5) zum Thema KI ausgewählt und qualitativ im Hinblick auf 
sprachliche Strategien der Konstitution von KI untersucht, wobei der Fokus auf 
Zuschreibungshandlungen gelegt wurde. 

Die Debattenreden sind über das Recherchetool Discourse Lab der TU Darm- 
stadt in aufbereiteter Form zugänglich, aber auch auf dem Dokumentenserver des 
Deutschen Bundestages recherchierbar.” Annotiert wurden Zuschreibungen in den 
Kategorien, Handlungen, Eigenschaften sowie Argumentationsmuster und Meta- 
phern. Dabei ist anzumerken, dass die Zuschreibungshandlungen häufig innerhalb 
von Argumentationen oder Metaphern erfolgen. Sowohl Zuschreibungen, Argu- 
mentationsmuster und Metaphern erfolgen aus einer je spezifischen Perspektive, 
somit geben diese sprachlichen Spuren einen Einblick in die ideologische Verortung 
des Gesagten bzw. Geschriebenen. 

Das Sprechen über Künstliche Intelligenz/KI stellt dabei kein Novum dar. Schaut 
man in die Bundestagsprotokolle, so findet sich die Verwendung des Ausdrucks seit 
1984. Zu diesem Zeitpunkt ist die Verwendung noch sehr gering, ein deutlicher 
Anstieg ist dann ab den 2015er Jahren im Deutschen Bundestag festzustellen. Be- 
sonders hoch ist der Wert jedoch 2018, denn da wurde im Bundestag über die 
Einsetzung einer Enquete-Kommission zum Thema KI debattiert (s.u.). 

Im DWDS-Zeitungskorpus findet sich eine erste Erwähnung im Jahre 1964, ein 
deutlicher Anstieg findet sich hier seit den 2015er Jahren (siehe hierzu Abbildung 4). 


17 Deutscher Bundestag, „Plenarprotokolle“, in [https:/www.bundestag.de/protokolle] (Zugriff: 
18.10.2023). 
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Künstliche Intelligenz im Deutschen Bundestag 
Verwendung pro 1 Mio. Token 


Abbildung 3: Verwendung des Ausdrucks Künstliche Intelligenz in Bundestagsdebattenreden. 


NEAR("künstliche","Intelligenz",1) - Verlaufskurve 


Basis: DWDS-Zeitungskorpus 
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———— NEAR("künstliche","Intelligenz",1): Zeitung 


Abbildung 4: DWDS-Wortverlaufskurve für „NEAR(„künstliche“,“Intelligenz“,1)“, erstellt durch das Di- 
gitale Wörterbuch der deutschen Sprache. '® 


18 [https://tip.de/o0gsy] (Zugriff: 13.10.2023). 
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5.1 Zuschreibungen 


Wie bereits oben kurz erläutert, stellen Zuschreibungshandlungen Phänomene dar, 
durch die Künstliche Intelligenz sprachlich konstituiert wird. Zuschreibungshand- 
lungen erfolgen dabei u.a. durch Attribuierungen oder Prädikationen, indem der 
Künstlichen Intelligenz Eigenschaften oder Handlungen zugewiesen werden. Da die 
erfolgten Zuschreibungen zumeist wertend sind (disruptiv, selbstlernend, wegwei- 
send etc.), kommen dabei zugleich Positionierungen zum Sachverhalt KI zum Aus- 
druck. Folgende Belege geben zunächst einen kleinen Einblick in Zuschreibungs- 
handlungen. Die Belege stammen aus der Bundestagsdebatte vom 28.6.2018, in der 
darüber abgestimmt wurde, ob eine Enquete-Kommission zum Thema „Künstliche 
Intelligenz — Gesellschaftliche Verantwortung und wirtschaftliche, soziale und 
ökologische Potenziale“ eingesetzt wird. Die Hervorhebungen wurden von mir 
hinzugefügt. 

(1) Sehr geehrter Herr Präsident! Liebe Kolleginnen und Kollegen! „Warum 
eine Enquete-Kommission zur KI?“, fragen viele, wo Frankreich bereits sein 
eigenes KI-Zentrum hat und die Bundesregierung in drei Wochen Eck 
punkte ihrer Strategie dazu vorstellen wird. Die Antwort liegt auf der Hand: 
Ich glaube, wir sind gut beraten, eine gesamtgesellschaftliche Debatte über 
diese neue disruptive Technologie zu führen. Künstliche Intelligenz ist eine 
oder vielleicht sogar die größte Treiberin der Digitalisierung. Mit dem 
Sprung von rechnender zur kognitiven Informatik stellt sie einen Paradig- 
menwechsel dar. Selbstlernende Maschinen können Dinge tun, die bislang 
nur Menschen konnten, und vieles, was sie tun, können sie besser, präziser 
und effizienter als wir: Berechnungen aus gigantischen Datenmengen, die 
kein Mensch Zeit seines Lebens so je erfassen könnte, gehören dazu, Pro- 
duktionsabläufe, Tätigkeiten wie Autofahren, Berufe im Banken-, Versic- 
herungs- und Gesundheitswesen. KI wird fast alle unsere Lebens- und Ar- 
beitsbereiche beeinflussen, und zwar mehr tiefgreifender und vermutlich 
auch schneller, als die meisten von uns sich das heute vorstellen können. Sie 
wird wegweisend sein für unsere Zukunft wie keine andere Entwicklung im 
technologischen Bereich. Möglicherweise stehen wir schon in Kürze vor 
bahnbrechenden Durchbriichen.’® 

(2) Wir erleben atemberaubende Entwicklungen, die wir zum Teil in ihren 
Auswirkungen auf Arbeitswelt und Umwelt, auf die Wirtschaft unseres 
Landes, aber auch auf das Wichtigste, das Menschsein, noch nicht voll- 


19 Sören Bartol (SPD), Bundestagsdebatte 19042, 19. Wahlperiode, 42. Sitzung, 28.6.2018; online 
unter [https://dserver.bundestag.de/btp/19/19042.pdf] (Zugriff: 16.10.2023). 
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ständig erfassen können. (Beifall bei der AfD) Menschsein, das ist mehr als 
Eizelle, Samen, DNA. Es ist der Verstand, die Kraft, zu gestalten. Es ist vor 
allem eines: Empathie. Sobald KI befähigt ist, kognitive, emotionale und 
soziale Intelligenz abzubilden, werden Risiken wie auch Chancen uns vor 
unvorstellbare Herausforderungen in allen Lebensbereichen stellen. KI 
ermöglicht aber auch staatliche Überwachung.” 

(3) Alles scheint möglich mit künstlicher Intelligenz. Deshalb ist es kein Hype, 
über den plötzlich alle sprechen, weil es gerade modern ist; es ist Fakt, dass 
KI derzeit der gröfste Treiber der Digitalisierung ist und nahezu alle Bereiche 
- von der Medizin über die Mobilität bis hin zur Produktion oder auch das 
Versicherungswesen, ja sogar das Management von Konzernen - beeinflusst 
und mitgestaltet. Diese enorme Entwicklung vollzieht sich nicht nur bei uns. 
Die größten Treiber sind US-amerikanische Großkonzerne und die Volks- 
republik China. Gerade bei China beobachten wir, dass massiv investiert 
wird, dass KI entwickelt und auch angewandt wird, allerdings auf einem 
ganz anderen Wertefundament, als wir das wollen.” 

(4) Wenn Marc Zuckerberg euphemistisch sagt, dass diejenigen, die gegen 
künstliche Intelligenz seien, sich dafür verantworten müssten, in Zukunft 
Krankheitsbekämpfung verhindert zu haben, so bin ich längst nicht bei 
ihm. Es macht mich nachdenklich, wenn Stephen Hawking als grandioser 
Physiker befürchtete, dass künstliche Intelligenz möglicherweise das 
Schlimmste sei, was der Menschheit passieren könnte.Vor dem Hintergrund 
dieser sehr unterschiedlichen Einschätzungen von künstlicher Intelligenz 
wäre es doch geradezu pflichtverletzend, wenn wir uns als Parlament mit 
dieser zukünftig stärker in die Gesellschaft eintretenden Technologie nicht 
befassen würden. Deswegen ist es richtig, dass wir die Enquete-Kommission 
einsetzen, die sich mit rechtlichen, ethischen und gesellschaftlichen Fragen 
zum Thema „Künstliche Intelligenz“ auseinandersetzen muss; denn anders 
als vor 20 oder auch 10 Jahren können wir heute Maschinen tatsächlich in 
die Lage versetzen, so intelligent zu entscheiden, wie das früher nur Men- 
schen konnten.” 


20 Uwe Kamann (AfD), Bundestagsdebatte 19042, 19. Wahlperiode, 42. Sitzung, 28.6.2018; online 
unter [https://dserver.bundestag.de/btp/19/19042.pdf] (Zugriff: 16.10.2023). 

21 Nadine Schön (CDU/CSU) Bundestagsdebatte 19042, 19. Wahlperiode, 42. Sitzung, 28.6.2018; online 
unter [https://dserver.bundestag.de/btp/19/19042.pdf] (Zugriff: 16.10.2023). 

22 René Röspel (SPD), Bundestagsdebatte 19042, 19. Wahlperiode, 42. Sitzung, 28.6.2018; online unter 
[https:/dserver.bundestag.de/btp/19/19042.pdf] (Zugriff: 16.10.2023). 
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Aus den gesamten hier zugrunde liegenden Daten lassen sich jedoch weitere Zu- 
schreibungen herausarbeiten. Tab. 1 gibt einen Überblick” über Zuschreibungen, 
die in den untersuchten Texten im Diskursausschnitt realisiert wurden. Die Zu- 
schreibungen werden in der Tabelle zunächst ohne nähere Kontexte präsentiert. 


Tabelle 1: Übersicht über sprachliche Realisierungen von Zuschreibungen. 


Zuschreibungen 


arbeitet 

arbeitet nachhaltig 

basiert auf mathematischen Reflexionen 
erschafft Welten 

hat kein Weltbild 

hat ungeahnte Möglichkeiten 

hat Ziele 

ist das Schlimmste, was Menschen passieren kann 
ist dumm 

ist genauer als der Mensch 

ist innovativ 

ist kompetent 

ist neutral 

ist präzise 


ist unerschöpflich 

kann Daten zusammenbringen 
kann den Menschen nicht ersetzen 
kann keine Entscheidungen treffen 
kann mit der Welt interagieren 
kann nicht nachvollziehen 

kann sich selbst replizieren 

kann warnen 

leitet ab 

lernt automatisch 

macht weniger Fehler als ein Mensch 
muss gefüttert werden 

schummelt nicht 

verfolgt Zwecke 


versteht nicht 
wird nicht müde 


ist produktiv 

ist revolutionar 

ist schnell 

ist so etwas wie ein Betriebssystem 
ist Treiber der Digitalisierung 


Die Liste umfasst nicht alle im untersuchten Ausschnitt realisierten Zuschreibun- 
gen, gibt aber einen Überblick über die Bereiche der Zuschreibungen. Betrachtet 
man nun die Zuschreibungen im Ganzen so lässt sich zunächst in zwei Typen von 
Zuschreibungen differenzieren. KI werden bestimmte Kompetenzen zugeschrieben, 
aber es wird auch artikuliert, was KI alles nicht kann und welche Gefahren mit ihr 
in Verbindung gebracht werden. Es handelt sich somit um Kompetenzzuschrei- 
bungen und um das Abschreiben von Kompetenzen sowie um damit verbundene 
Gefahrenbenennungen, die als Argumente innerhalb des argumentativen Verfah- 
rens vorgebracht werden, wodurch aber implizit auch wieder Zuschreibungen er- 
folgen. So werden im Zug der Kompetenzzuschreibung, -abschreibung und Gefah- 
renbenennung Argumente für oder gegen KI, für eine kritische oder eine 


23 Die Tabelle ist nicht exhaustiv. 


Keine Panik vor der KI — 375 


bedenkenlose Bewertung von KI vorgebracht, wie folgender Beleg zum Ausdruck 
bringt. 

(5) Die Fahigkeiten zur Vorhersage, zur Analyse und Evaluation, zum Schrei- 
ben und Denken - die Fahigkeitsbereiche der Rationalisierer und Wegra- 
tionalisierer im Management - drohen, durch KI automatisiert zu werden.”* 

Es lasst sich exemplarisch an Beleg 5 zeigen, dass Zuschreibung in Argumentati- 
onsmuster eingebettet sind. Hier werden die Zuschreibungen Fähigkeit zur Vor- 
hersage, zur Analyse, Evaluation, Schreiben und Denken mit KI in Verbindung ge- 
bracht und in einen Gefahrentopos integriert, der genau diese 
Kompetenzzuschreibung als Gefahr für eine bestimmte Berufsgruppe artikuliert. 
Die Gefahrenbenennung erfolgt hier durch die Verben drohen und automatisieren. 
Sie stellt ein Argument für eine kritische Bewertung von KI dar (s.u.). 

Auffällig sind zudem jene Zuschreibungen, die als typisch menschliche Eigen- 
schaften gelten und die nun auf KI appliziert werden und durch Ausdrücke wie z.B. 
lernen, Zwecke verfolgen, nicht verstehen, schummeln, erschaffen, interagieren, 
kennen deutlich werden. In Beleg 6 wird durch den Relativsatz das seine Nutzer 
noch sehr viel besser kennen wird eine Zuschreibung vorgenommen, die die Fä- 
higkeit der Menschenkenntnis mit KI in Verbindung bringt. So wird KI sprachlich 
als ein Gegenstand konstruiert, der quasi-menschliche Eigenschaften besitzt. 

(6) Generative künstliche Intelligenz ist ein sich selbst verstärkendes System, 
das seine Nutzer noch sehr viel besser kennen wird und ihnen noch mehr 
das liefern wird, was sie gerne mögen, wollen, suchen, als die Algorithmen 
des World Wide Web es bisher tun.” 


5.2 Metaphorisierungen 


Zuschreibungen werden im Diskurs über KI nicht selten auch in Form von Meta- 
phern realisiert. Metaphern zeichnen sich dadurch aus, dass im Metaphorisie- 
rungsprozess zwei Bereiche/Konzepte zueinander in Bezug gesetzt werden, die auf 
den ersten Blick nichts miteinander zu tun haben. Dabei strukturiert ein Bereich/ 
Konzept (Herkunftsbereich) den andern Bereich/das andere Konzept (Zielbereich). 
Bedeutungsaspekte des Herkunftsbereiches werden auf den Zielbereich projiziert,” 


24 Philipp Bovermann, „KI-Magazin. Die Konkurrenz ist da“, SZ, 14.08.2023, in [https://www.sz.de/l. 
6127286] (Zugriff: 18.10.2023). 

25 Andrian Kreye, „Fühlt euch nicht zu sicher“, SZ, 27.08.2023, in [https://www.sz.de/1.6016140] 
(Zugriff: 18.10.2023). 

26 Vgl. hierzu Wolf-Andreas Lieber, „Metaphernforschung“, in Handbücher zur Sprach- und Kom- 
munikationswissenschaft, Bd. 31, Rhetorik und Stilistik, hg. von Ulla Fix et al., Berlin/Boston 2008; 
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wobei aber nicht alle Bedeutungsaspekte des Herkunftsbereiches im Metaphori- 
sierungsprozess zur Geltung gebracht werden, sondern nur ganz bestimmte As- 
pekte zentral sind, andere treten dafür in den Hintergrund. Lakoff und Johnson 
sprechen hier von den Prinzipien des Highlighting und des Hiding.” Metaphern 
erfüllen im Kontext der KI-Debatte verschiedene Funktionen, zum einen perspek- 
tivieren sie den kommunizierten Sachverhalt, zum anderen werden neue techni- 
sche Verfahren verstehbar gemacht, insofern sie mit allseits bekannten Konzepten 
erläutert werden, was sich in den hier präsentierten Metaphern in besonderer 
Weise zeigt, denn mit ihnen werden Eigenschaften der KI verdeutlicht. 

Mit der Gehirn-Metaphorik wird KI im vorliegenden Diskursausschnitt als 
künstliches Super-Hirn konzeptualisiert, das unter Hinzunahme von Verkehrsme- 
taphorik (kleine Straße, werden immer breiter) mit dem menschlichen Gehirn ver- 
glichen wird, wie Beleg 7 zeigt. KI- hier im medizinischen Bereich — wird dabei eine 
Kompetenz zugeschrieben, die im Bereich von menschlichen Kompetenzen liegt, 
diesen aber durch ihre schnelle ordnende Fähigkeit aber zugleich übersteigt, was 
durch die Aussage All die Daten, die jeden Tag im Gesundheitswesen anfallen, sind oft 
kompliziert und ungeordnet, niemand kann sie überblicken zum Ausdruck gebracht 
wird. Sie wird so einerseits durch Prädikationen (ist wie ein Gehirn) und Hand- 
lungszuschreibungen (lernen, Vorhersagen zu treffen) sowie durch eine in diesem 
Kontext erfolgte Negativbeschreibung der Kompetenzen des Menschen (niemand 
kann sie überblicken) positiv bewertet und als Bereicherung des menschlichen Da- 
seins aufgefasst. 

(7) „All die Daten, die jeden Tag im Gesundheitswesen anfallen, sind oft kom- 

pliziert und ungeordnet, niemand kann sie überblicken. Wir wollen diese 
Daten anonymisiert sammeln und Zusammenhänge erkennen, wir suchen 
nach Trends, leiten ein Krankheitsbild ab. Wir simulieren also ein künst- 
liches neuronales Netz, ähnlich wie ein Gehirn. Wie im echten Gehirn auch 
sind unsere „Gehirnzellen“ durch kleine Straßen verbunden. Und die 
wichtigsten werden immer breiter, die weniger wichtigen nutzen wir nicht 
mehr. Dafür schicken wir Bilder rein, Krankenberichte, Blutwerte, und das 
Netz lernt daraus, wie der Ausgang dann wahrscheinlich sein wird. Wir 
lernen, Vorhersagen zu treffen.’ 


Constanze Spieß, „Metapher als multimodales kognitives Funktionsprinzip“, in Sprache im multi- 
modalen Kontext, hg. von Nina-Maria Klug/Hartmut Stöckl, Berlin/Boston 2016; Constanze Spieß, 
„Metaphern“, in Handbuch Sprache in Politik und Gesellschaft, hg. von Kersten Roth et al., Berlin/ 
Boston 2017b. 

27 George Lakoff/Mark Johnson, Metaphors We Live by, Chicago 1980; vgl. dazu auch Spieß 2016. 
28 Felix Hütten, „Die KI wird nicht müde‘, SZ, 23.08.2023, in [https://www.sz.de/1.6074505] (Zugriff: 
18.10.2023). 
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In kritischeren Positionierungshandlungen finden sich verschiedene Realisierun- 
gen der Ernährungsmetapher, mit der KI sprachlich als gefräßiges Objekt (Beleg 8) 
konstituiert wird, das permanent gefüttert werden muss. In diesem Zusammenhang 
wird z.B. in Beleg 9 auf die negativen Entwicklungen (Datenklau, Plagiate) auf- 
merksam gemacht und auch im Bereich sozialer Faktoren auf negative Entwick- 
lungen (Niedrigslohn-Verhältnisse) verwiesen. In Beleg 10 findet sich ein indirekter 
Appell an die Nutzer:innen/Adressat:innen des Textes (stattdessen sollte man darauf 
achten), im Blick zu behalten, welche Daten KI verarbeitet. Hier wird KI implizit als 
ein Sachverhalt gefasst, der gefährlich sein kann, bei entsprechender Kontrolle/ 
Beobachtung aber nicht gefährlich sein muss. Der Aspekt der Kontrolle wird durch 
die Appellhandlung (stattdessen sollte man darauf achten) realisiert. Die Adressat: 
innenstruktur bleibt dabei etwas vage, so ist nicht klar, ob sich der Appell an die 
Nutzer:innen, die Politiker:innen oder sonstige Verantwortliche richtet. 

(8) Millionen von urheberrechtlich geschützten Büchern, Artikeln, Aufsätzen 
und Gedichten liefern die ‚Nahrung‘ für KI-Systeme, endlose Mahlzeiten, 
für die niemand bezahlt.” 

(9) Das waren Plagiate, Sammlungen geklauter Texte, aber auch reines Da- 
tengulasch, das keinen Sinn ergab. Erschwerend hinzu kommt, dass auch 
Datenarbeiter die Kls füttern - sie arbeiten in Niedrigstlohn-Verhältnissen 
und verwenden teils selbst Chat-GPT, um die angeblich handgeschriebe- 
nen Texte schneller zu generieren.’ 

(10) Viele Menschen fürchten sich heute vor der KI. Vielleicht sollten sie es 
auch. Sie wissen, dass KI sich von Daten ernährt. Ohne Daten ist KI gar 
nichts. Darum muss man sich also nicht vor der KI fürchten. Stattdessen 
sollte man darauf achten, was eine KI frisst und was mit den Daten ge- 
schieht.** 

Deutlich wird bei der Verwendung von Metaphorik jedenfalls, dass diese in kom- 
plexe argumentative Handlungen der Gefahren- und Risikoabwägung, aber auch 
der Nutzenbekundungen eingebunden sind. Im Folgenden werden zwei zentrale 
Argumentationsmuster, die im Diskursausschnitt immer wieder realisiert werden, 
prasentiert. 


29 Andrian Kreye, „Widerstand“, SZ, 20.07.2023, in [https://www.sz.de/1.6047873] (Zugriff: 18.10. 
2023). 

30 Andrian Kreye, „Künstliche Verblödung“, SZ, 17.07.2023, in [https://www.sz.de/1.6038190] (Zugriff: 
18.10.2023). 

31 Alex „Sandy“ Pentland, „Der menschliche Faktor“, SZ, 23.07.2019, in [https://www.sz.de/14536044] 
(Zugriff: 18.10.2023). 
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5.3 Argumentationsmuster 


Zuschreibungshandlungen werden genutzt, um Argumente vorzubringen und die 
eigene Position zu untermauern oder aber um die Position anderer zu widerlegen. 
Argumentationen bestehen in ihrer Grundstruktur nach Toulmin aus einer strit- 
tigen These, den Argumenten (bzw. Daten) und einer Schlussregel.?” Zuschreibun- 
gen übernehmen dabei unterschiedliche Funktionen in der komplexen Argumen- 
tationshandlung ein. Sie können Teil der These, aber auch Elemente der 
vorgebrachten Argumente sein. Betrachtet man mehrere Texte bzw. größere Text- 
mengen bietet es sich an, nach der Musterhaftigkeit von Argumentationen zu 
schauen. Hierfür hat sich in der Disziplin der Diskurslinguistik die Methode der 
Argumentationstoposanalyse etabliert. Mit Wengeler lassen sich Argumentations- 
topoi bzw. Argumentationsmuster als musterhafte Ausprägung der Schlussregel, die 
durch Argumente die strittige These in eine unstrittige überführt, definieren. Unter 
einem Argumentationstopos versteht Wengeler entsprechend „[...] einen vielseitig 
verwendbaren, für den Argumentierenden bereitliegenden und von ihm dann 
sprachlich hergestellten Sachverhaltszusammenhang, der zur argumentativen Be- 
gründung konkreter, zur Diskussion stehender Positionen herangezogen wird.“ 
Zwei Muster sind dabei in den untersuchten Texten hervorgetreten, denen konse- 
quentialistische Argumentationen zugrunde liegen, die sich aber inhaltlich gegen- 
überstehen, da sie innerhalb des Diskurses unterschiedliche Funktionen (pro oder 
contra KI) erfüllen. Für den untersuchten Ausschnitt aus dem KI-Diskurs zeigt sich 
das folgendermaßen: Während einerseits in der KI ein großer Nutzen für die 
Menschheit konstatiert wird, gibt es aber auch skeptische Stimmen im Diskurs, die 
die Gefahren, die von KI ausgehen können oder mit KI verbunden sind, themati- 
sieren. Beide Topoi stellen Ausprägungen konsequenzialistischer Argumentation- 
stopoi dar. Bei der Gefahrenbenennung wird häufig gefordert, Grenzen zu ziehen 
und KI auf der Basis bestimmter Kriterien zu regulieren. 


32 Stephen Toulmin, The uses of argument, Cambridge 1958. 

33 Martin Wengeler, „Argumentationsmuster im Bundestag. Ein diachroner Vergleich zweier De- 
batten zum Thema Asylrecht“, in Sprache des deutschen Parlamentarismus. Studien zu 150 Jahren 
parlamentarischer Kommunikation, hg. von Armin Burkhardt/Kornelia Pape, Wiesbaden 2000, 222; 
zur Argumentation in öffentlichen Diskursen vgl. Constanze Spieß, „Argumentieren in Diskursen“, 
in Handbuch ‚Sprache und Politik‘, hg. von Jörg Kilian/Thomas Niehr/Martin Wengeler, Bremen 
2017a. 


Tabelle 2: Zentrale Argumentationstopoi. 


Gefahrentopos 


Weil KI große Gefahren birgt, muss sie / muss ihre 
Entwicklung reguliert werden. 
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Topos vom gesellschaftlichen Nutzen 


Weil KI großen Nutzen fur die Gesellschaft hat, muss 
ihr Einsatz forciert werden. 


(11) „Es geht aber auch darum, Risiken zu mini- 
mieren. Wir stehen vor der Entscheidung - ich 
glaube, dass wir die Entscheidung noch treffen 
können; das sage ich in Richtung des Zwischen- 
rufers -, ob wir die Veränderungen designen 
oder ob wir verändert werden. Bevor die Dy- 
namik zunimmt und man wie auf einer schiefen 
Ebene ein bisschen ins Rutschen kommt, ist es gut, 
dass wir jetzt Leitplanken und Haltegriffe einset- 
zen und uns darüber verständigen, wo Grenzen 
sind. Genau das können wir in einer Enquete- 
Kommission tun. Es geht um viel. Ich sage es 
einmal ganz dramatisch: Es geht um Leben und 
Tod, wenn wir zum Beispiel darüber reden, wie 
viel Autonomie wir bei Waffensystemen zulassen 
wollen bzw. ob es Punkte gibt, an denen immer 
noch ein Mensch die Entscheidung treffen soll. 
Das ist eine politische Entscheidung - nicht nur in 
Deutschland, sondern weltweit. Es geht um unsere 
Freiheit. Das sehen wir, wenn wir nach China 
schauen.“ 


(12) „Ich will, dass wir in Deutschland die Chancen 
durch KI maximieren und Risiken minimieren und 
dass wir mit einer intelligenten Industriepolitik dafür 
sorgen, dass mit KI neue Arbeitsplätze entstehen. KI 
bietet unglaubliche Chancen für die Menschheit. Mit 
KI rückt die Vision, der Menschheitstraum von ei- 
nem Leben ohne Mühsal in greifbare Nähe, eine 
Zukunft, in der lernfähige Maschinen für uns ar- 
beiten, uns unangenehme schwere Tätigkeiten ab- 
nehmen und der Mensch durch weniger Arbeit und 
mehr Wohlstand ein Leben mit mehr Zeit für Fa- 
milie, Freizeit, Selbstverwirklichung, Bildung und 
Kultur hat. Kurz: KI bietet die Chance auf ein bes- 
seres Leben für alle, vorausgesetzt, wir sorgen dafür 
- wie der kürzlich verstorbene Nobelpreisträger 
Stephen Hawking sagte -, dass der maschinell 
produzierte Reichtum auch verteilt wird.“ 

(13) „Künstliche Intelligenz ist kein Schicksal oder 
Alien, das vom Himmel auf uns gefallen ist, um uns 
zu versklaven, auch wenn der eine oder andere 
Zeitungsbericht dies anders darstellt. Vielmehr ist es 
eine Revolution in der Informatik, eine Informatik 
2.0, wenn Sie so wollen, in der der Entwickler nicht 
mehr zwingend den Weg zum Ziel direkt kennen 
oder verstehen muss. Der Algorithmus probiert 
selbstständig aus und erlernt, ähnlich wie ein Kind, 
durch Wiederholen Muster für kommende Hand- 
lungen. Diese Veränderungen und die daraus re- 
sultierenden Möglichkeiten könnten der Schlüssel 
sein, um die digitale Transformation entscheidend 
voranzutreiben und alle in der Gesellschaft davon 
profitieren zu lassen.“”° 


34 Daniela Kolbe (SPD), Bundestagsdebatte 19042, 19. Wahlperiode, 42. Sitzung, 28.6.2018; online 
unter [https://dserver.bundestag.de/btp/19/19042.pdf] (Zugriff: 16.10.2023). 

35 Sören Bartol (SPD), Bundestagsdebatte 19042, 19. Wahlperiode, 42. Sitzung, 28.6.2018; online 
unter [https://dserver.bundestag.de/btp/19/19042.pdf] (Zugriff: 16.10.2023). 

36 Mario Brandenburg (FDP), Bundestagsdebatte 19042, 19. Wahlperiode, 42. Sitzung, 28.6.2018; 
online unter [https://dserver.bundestag.de/btp/19/19042.pdf] (Zugriff: 16.10.2023). 
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Weitere Topoi, die im untersuchten Ausschnitt vorgebracht wurden und in den 
Bereich des Religiösen fallen, aber ebenfalls zu den konsequenzialistischen Topoi 
gehören, sind der Wohlstands-Topos oder der Lebenserschaffungs-Topos, wie sie in 
den Belegen 12 und 14 realisiert werden. In Beleg 12 wird der Wohlstandstopos als 
eine Ausprägung des Topos vom gesellschaftlichen Nutzen realisiert. Mit ihnen 
werden der KI vornehmlich positive Eigenschaften zugeschrieben und der gesell- 
schaftliche Nutzen von KI hervorgehoben. Zieht man Beleg 12 heran, so zeigt sich 
hier eine sprachliche Etablierung einer paradiesischen Welt,” die als Vision, als 
Menschheitstraum von einem Leben ohne Mühsal konzeptualisiert wird. Es wird 
eine Vorstellung konstruiert, in der KI unangenehme Arbeiten erledigt, während 
der Mensch dadurch mehr Wohlstand erreicht. Der Wohlstandstopos lässt sich 
folgendermaßen formulieren: Weil KI sich unter bestimmten Voraussetzungen als 
Chance für mehr Wohlstand für alle (auf ein besseres Leben für alle) erweist, muss sie 
eingesetzt werden. In Beleg 14 liegt ein Topos der Lebenserschaffung vor (Weil KI 
sich selbst replizieren, sich rasch verbessern etc. kann, wird sie neues Leben er- 
schaffen); KI wird innerhalb des Topos die Fähigkeit zugeschrieben neues Leben 
erschaffen zu können, was durch den Sprecher positiv bewertet wird. 


Lebenserschaffungs-Topos 
(14) „Interessant wird es, sobald sie [KI-Roboter, ergänzt CS] sich physikalisch 
selbst replizieren können. Wenn zum Beispiel auf dem Merkur ein solar- 
getriebener 3-D-Drucker sich mit anderen zusammenschließt und sie all die 
Teile drucken können, aus denen sie bestehen, und auch die Teile, aus 
denen die Roboter bestehen, die die entsprechenden Rohstoffe einholen 
und die gedruckten Teile zusammenbasteln, sodass die gesamte Maschi- 
nengesellschaft sich selbst kopieren kann. Dann hat man zum ersten Mal 
eine neue Sorte von Leben, die nichts mit Biologie zu tun hat und sich 
trotzdem vervielfältigen kann. Und sich rasch verbessern kann in einer 
Weise, die traditionellem Leben verwehrt ist. Das wird kommen, und das 
Tolle daran ist, dass der gigantische Weltenraum solchen Systemen einen 


37 Im Digitalen Wörterbuch der Deutschen Sprache findet sich unter ‚Paradies‘ folgender Eintrag, 
der zwei Bedeutungsdimensionen umfasst, wobei die zweite Bedeutung aus der ersten hervorgeht: 
1. [Religion] „Stätte des immerwährenden Glücks, die nach dem Alten Testament Gott den ersten 
Menschen zum Aufenthalt geschaffen hat, Garten Eden“; 2. [übertragen] „Zustand, Ort des unge- 
trübten Glücks“. „Paradies“, bereitgestellt durch das Digitale Wörterbuch der deutschen Sprache, in 
[https:/www.dwds.de/wb/Paradies] (Zugriff: 13.10.2023). 
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bisher unerschlossenen Lebensraum bietet, der unermesslich groß ist im 
Vergleich zur winzigen Biosphäre.“”® 
Im Kontext des Topos der Lebenserschaffung wird zudem die Bedeutung des Be- 
griffs Leben verhandelt und im Sinne des Diskursakteurs spezifiziert, wenn KI als 
neue Sorte von Leben bestimmt wird, die aber nichts mit Biologie zu tun hat. Das 
Merkmal der ‚Vervielfältigung‘ wird stattdessen als zentrales Merkmal für Leben 
behauptet. 


6 Resümee 


Die sprachlichen Phänomene, mit denen im untersuchten Diskursausschnitt auf KI 
referiert wird oder mit denen KI beschrieben oder argumentiert wird, geben Auf- 
schluss darüber, welche Vorstellungen Diskursakteur:innen im gewählten Aus- 
schnitt von KI haben. Bemerkenswert ist, betrachtet man die Befunde aus dem 
untersuchten Diskursausschnitt, eine anthropomorphisierende Darstellung von KI 
durch Handlungszuschreibungen von menschlichen Kompetenzen, die KI aber zu- 
meist besser bewältigen kann als der Mensch. Durch Benennung von Eigenschaften 
der KI durch Prädikationen, Attribuierungen und Metaphorisierungen werden der 
KI ebenso quasi-menschliche Fähigkeiten zugeschrieben, die schließlich als Argu- 
mente für den Einsatz und die Weiterentwicklung von KI vorgebracht werden. Die 
Zuschreibungen spielen aber auch eine Rolle beim kritischen Abwägen von Chan- 
cen und Risiken. Durch das Sprechen über KI werden Vorstellungen von KI einer- 
seits, aber auch Vorstellungen vom Menschen und dessen Verhältnis zur Techno- 
logie der KI andererseits deutlich.*? 


38 Andrian Kreye, „Menschen werden weniger bedeutend sein“, SZ, 04.08.2023, in [https://www.sz. 
de/1.6051518] (Zugriff: 16.10.2023). 
39 Das Gesamtkorpus kann bei der Autorin eingesehen werden. 
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Eine transdisziplinäre Analyse 


Abstract: Based on the conference theme „AI - Text and Validity. How do AI text 
generators change scientific discourse?“ and the special topic „Collective human- 
machine intelligence using the example of text generation“, the possible interaction 
relationship between text generators and a scientific discourse will be played out in 
atransdisciplinary analysis. For this purpose, the concept of scientific discourse will 
be specified on a case-by-case basis using the text types empirical theory as well as 
sustained empirical theory in such a way that the role of human and machine actors 
in these discourses can be sufficiently specified. The result shows a very clear li- 
mitation of current text generators compared to the requirements of a scientific 
discourse. These considerations are extended by the phenomenon of time, which 
forces something new, as well as by an extrapolation of the possibilities of a 
transdisciplinary analysis in the direction of a possible super-theory. Finally, it is 
argued that the concept of intelligence should be banished from everyday discourse 
altogether; its informational value is now approaching zero. A refocusing on po- 
pulations of biological adaptive agents is recommended. 


1 Ausgangspunkt 


Dieser Text nimmt seinen Ausgangspunkt bei dem Tagungsthema „KI - Text und 
Geltung. Wie verändern KI-Textgeneratoren wissenschaftliche Diskurse?“ und er- 
gänzt dieses Thema um die Perspektive einer Kollektiven Mensch-Maschine Intel- 
ligenz am Beispiel von Textgenerierung. Die in dieser Konstellation aufgerufenen 
Begriffe Text und Geltung, KI-Textgeneratoren, wissenschaftliche Diskurse sowie 
Kollektive Mensch-Maschine Intelligenz repräsentieren unterschiedliche Bedeu- 
tungsfelder, die nicht automatisch als Elemente eines gemeinsamen begrifflichen 
Rahmens interpretiert werden können. 


8 Open Access. © 2024 bei den Autorinnen und Autoren, publiziert von De Gruyter. Dieses Werk ist 
lizenziert unter einer Creative Commons Namensnennung - Nicht kommerziell - Keine Bearbeitung 4.0 International 
Lizenz. https:/doi.org/10.1515/9783111351490-024 
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2 Transdiziplinär 


Um die genannten Begriffe als Elemente in einem gemeinsamen begrifflichen Rah- 
men auftreten lassen zu können, bedarf es einer Meta-Ebene, von der aus man über 
diese Begriffe und ihre möglichen Beziehungen untereinander sprechen kann. 
Diese Vorgehensweise ist üblicherweise in der Wissenschaftsphilosophie verortet, 
die nicht nur einzelne Begriffe oder ganze Sätze zum Gegenstand haben kann, 
sondern gar ganze Theorien, die miteinander verglichen oder möglicherweise sogar 
vereint werden. Der heute oft benutzte Begriff transdisziplinär' wird hier in diesem 
wissenschaftsphilosophischen Verständnis als ein Vorgehen verstanden, bei dem 
die Integration unterschiedlicher Begriffe durch Einführung geeigneter Meta-Ebenen 
eingelöst wird. Eine solche Meta-Ebene repräsentiert letztlich immer auch eine 
Struktur, in der sich alle wichtigen Elemente und Beziehungen versammeln können. 


3 Strukturbildung 


Hier wird der Begriff wissenschaftlicher Diskurs als eine Grundsituation ange- 
nommen, an der verschiedene Akteure beteiligt sein können. Als wichtigste Typen 
von Akteuren werden hier Menschen betrachtet, die als Art Homo sapiens einen Teil 
der biologischen Systeme auf dem Planet Erde repräsentieren, und Text-Generato- 
ren, die ein technisches Erzeugnis repräsentieren, das aus einer Kombination aus 
Software und Hardware besteht. 

Von den Menschen wird angenommen,” dass sie ihre Umgebung und sich selbst 
art-typisch wahrnehmen, Wahrgenommenes intern verarbeiten und speichern 


1 Jürgen Mittelstraß umschreibt die mögliche Bedeutung des Begriffs Transdisziplinarität als ein 
„Forschungs- und Wissenchaftsprinzip [...] das überall dort wirksam wird, wo eine allein fachliche 
oder disziplinäre Definition von Problemlagen und Problemlösungen nicht möglich ist [...]“. Jürgen 
Mittelstraß „Methodische Transdisziplinarität“, LIFIS ONLINE, in [https:/leibniz-institut.de/archiv/ 
mittelstrass_05_11_07pdf], (Zugriff: 27.09.2023), (zuerst erschienen in Technologiefolgenabschät- 
zung — Theorie und Praxis Nr. 2, 2005, 18-23). In seinem Text grenzt Mittelstraß die Transdiszipli- 
narität ab vom Disziplinären und vom Interdisziplinären. Allerdings belässt er es bei einer allge- 
meinen Charakterisierung von Transdisziplinarität als forschungsleitendem Prinzip und 
wissenschaftlicher Organisationsform. Die konkrete begriffliche Ausgestaltung von Transdiszipli- 
narität hält er offen. Anders im vorliegenden Text: Hier wird die transdisziplinäre Thematik auf die 
Konkretheit der verwandten Begriffe herunterprojiziert und — wie in der Wissenschaftsphilosophie 
(und Meta-Logik) üblich — mittels des Konstrukts von Meta-Ebenen realisiert. 

2 Die folgende Charakterisierung des menschlichen Akteurs wird auf der Meta-Ebene vorgenom- 
men und kann in diesem Rahmen nur sehr skizzenhaft sein, um eine übergreifende Darstellung zu 
ermöglichen. Die Details dieser Skizze würden mehrere Bücher füllen. 
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Abbildung 1: Wissenschaftlicher Diskurs - Transdisziplinäre Sicht. 


können, Gespeichertes in begrenztem Umfang art-typisch wieder erinnern und auf 
art-typische Weise verändern können, so dass interne Strukturen entstehen können, 
die für Handeln und Kommunikation verfügbar sind. Alle diese Elemente werden 
der menschlichen Kognition zugerechnet. Diese funktioniert partiell bewusst, 
weitgehend aber unbewusst. Zur Kognition gehört auch noch das Subsystem Spra- 
che, welches eine Struktur repräsentiert, die einerseits weitgehend art-typisch 
festliegt, sich andererseits aber flexibel auf unterschiedliche Elemente der Kogni- 
tion abbilden lässt. In der Begrifflichkeit der Semiotik? repräsentiert das Sprach- 
system eine symbolische Ebene, und jene Elemente der Kognition, auf welcher die 
symbolischen Strukturen abgebildet werden, bilden Korrelate der Bedeutung, die 
allerdings nur insoweit eine Bedeutung darstellen, als sie in einer Abbildungsbe- 
ziehung — auch Bedeutungsbeziehung genannt - vorkommen. Ein kognitives Element 
als solches stellt keine Bedeutung im sprachlichen Sinne dar. Neben der Kognition 
gibt es eine Vielzahl von emotionalen Faktoren, die sowohl die kognitiven Prozesse 
wie auch den Prozess des Entscheidens beeinflussen können. Letzterer wiederum 
kann Denk- wie auch Handlungsprozesse beeinflussen, bewusst wie auch unbe- 
wusst. 


3 Siehe überblicksmäßig z.B. Winfried Noth, Handbuch der Semiotik, Stuttgart/Weimar 22000. 
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Die genaue Bedeutung dieser aufgeführten Strukturelemente erschließt sich in 
einem Prozessmodell* ergänzend zu dieser Struktur. 


4 Teilprozess symbolische Kommunikation 


Wichtig für menschliche Akteure ist, dass diese im Rahmen einer symbolischen 
Kommunikation sowohl mit Hilfe von gesprochener wie auch mit Hilfe von ge- 
schriebener Sprache interagieren können. Hier wird — vereinfachend - angenom- 
men, dass man gesprochene Sprache hinreichend genau in geschriebene Sprache 
abbilden kann, was im Standardfall als Text bezeichnet wird. Dabei ist zu beachten, 
dass Texte nur dann eine Bedeutung repräsentieren, wenn die beteiligten Text-Er- 
zeuger wie auch die Text-Rezipienten über eine Bedeutungsfunktion verfügen, die 
hinreichend ähnlich ist. 

Für Texte von menschlichen Texterzeugern gilt im Allgemeinen, dass in Bezug 
auf konkrete Situationen Aussagen als Teil von Texten unter vereinbarten Bedin- 
gungen als jetzt zutreffend (wahr) oder als jetzt nicht-zutreffend (falsch) qualifiziert 
werden können. Ein jetzt-zutreffend kann aber im nächsten Moment auch wieder zu 
einem nichtzutreffend werden und umgekehrt. Dieser dynamische Sachverhalt 
verweist darauf, dass ein punktuelles Zutreffen beziehungsweise Nicht-Zutreffen ei- 
ner Aussage zu unterscheiden ist, von einem strukturellen Zutreffen/Nicht Zutreffen 
einer Aussage, die kontextbezogen über Zutreffen/Nicht-Zutreffen spricht. Damit 
wird Bezug genommen auf Beziehungen, die sich im Kontext einer Vielzahl von 
Einzelereignissen nur indirekt zeigen, falls man Ereignisketten über viele Zeitpunkte 
betrachtet. Schließlich muss man auch noch berücksichtigen, dass die Bedeu- 
tungskorrelate primär im Innern des biologischen Systems Mensch verortet sind. 
Bedeutungskorrelate sind als solche nicht automatisch zutreffend, sondern nur, 
wenn es eine aktive Korrespondenz zwischen einem erinnerbaren/gedachten/vor- 
stellbaren Bedeutungskorrelat und einem aktiven Wahrnehmungselement gibt, wo- 
bei dem Wahrnehmungselement ein intersubjektiver Sachverhalt korrespondieren 
muss. Nur weil jemand über ein Kaninchen spricht und der Rezipient versteht, was 
ein Kaninchen ist, heißt dies noch nicht, dass es auch gerade ein reales Kaninchen 
gibt, das der Rezipient wahrnehmen kann. 


4 Solch ein Prozessmodell wird hier nur in Teilaspekten angedeutet. 
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5 Text-Generatoren 


Bei der Unterscheidung der zwei verschiedenen Arten von Akteuren - hier biolo- 
gische Systeme der Art Homo sapiens und dort technische Systeme des Typs Text- 
Generatoren - sticht sofort eine erste grundlegende Asymmetrie ins Auge: Soge- 
nannte Text-Generatoren sind Gebilde, die von Menschen erfunden und gebaut 
wurden; es sind ferner Menschen, die diese Generatoren benutzen, und das we- 
sentliche Material, das von Text-Generatoren benutzt wird, sind wiederum Texte, 
die bislang als menschliches Kulturgut gelten, geschaffen und genutzt von Menschen 
für eine Vielzahl von Diskurstypen, hier eingeschränkt auf wissenschaftliche Dis- 
kurse. 

Im Falle von Text-Generatoren soll hier zunächst nur so viel festgehalten 
werden, dass wir es mit Maschinen zu tun haben, die über Input und Output ver- 
fügen, dazu über eine minimale Lernfähigkeit, und deren Input und Output text- 
ähnliche Objekte verarbeiten kann. 

Insofern Text-Generatoren textähnliche Objekte als Input verarbeiten und als 
Output wieder ausgeben können, kann prinzipiell ein Austausch von Texten zwi- 
schen Menschen und Text-Generatoren stattfinden. 

Beim aktuellen Entwicklungszustand (September 2023) verfügen Text-Genera- 
toren im Rahmen ihres Inputs noch nicht über eine eigenständige Realwelt-Wahr- 
nehmung und auch noch nicht über solche Prozesse, wie jene, die beim Menschen 
art-typische Kognitionen ermöglichen. Ferner verfügt ein Text-Generator noch nicht 
über eine Bedeutungsfunktion, wie sie beim Menschen gegeben ist. Dies bedeutet, 
dass ein Text-Generator in keinem Moment einem erzeugten Text irgendeine Be- 
deutung zuordnen kann. 

Aus diesem Sachverhalt ergibt sich automatisch, dass Text-Generatoren im Falle 
von Aussagen eines Textes nicht über punktuelles oder strukturelles Zutreffen/Nicht- 
Zutreffen entscheiden können. Texte, erzeugt von Text-Generatoren, haben nur dann 
eine Bedeutung, wenn ein Mensch als Rezipient aufgrund seiner art-typischen 
Bedeutungsbeziehung einem Text automatisch eine Bedeutung zuordnet, weil dies 
das erlernte Verhalten eines Menschen ist. Salopp könnte man auch formulieren, 
dass ein technischer Text-Generator wie ein Parasit funktioniert: er sammelt Texte 
ein, die der Mensch erzeugt hat, ordnet sie nach formalen Kriterien für die Ausgabe 
kombinatorisch neu an, und für einen rezipierenden Menschen wird durch den 
Text im Menschen automatisch ein Bedeutungsereignis ausgelöst, das im Text-Ge- 
nerator nirgendwo existiert. 

Ob diese sehr eingeschränkte Form der Text-Generierung nun in irgendeinem 
Sinne für den Typus wissenschaftlicher Diskurs (mit Texten) abträglich oder vor- 
teilhaft ist, das soll im weiteren Verlauf untersucht werden. 
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6 Wissenschaftlicher Diskurs 


Für den Begriff wissenschaftlicher Diskurs gibt es keine eindeutige Definition. Dies 
ist nicht überraschend, da eine eindeutige Definition voraussetzt, dass es einen 
vollständig spezifizierten begrifflichen Rahmen gibt, innerhalb dessen sich Begriffe 
wie Diskurs und wissenschaftlich klar eingrenzen lassen. Bei einem Wissen- 
schaftsbetrieb mit globaler Ausdehnung, aufgegliedert in zahllose Einzeldiszipli- 
nen, erscheint dies aktuell aber nicht gegeben zu sein. Für das weitere Vorgehen 
wird hier daher zurückgegriffen auf Kerngedanken der wissenschaftsphilosophi- 
schen Diskussion seit dem 20. Jahrhundert,° und es werden hier Arbeitshypothesen 
zur Begrifflichkeit empirische Theorie sowie nachhaltige empirische Theorie ein- 
geführt, so dass dann auch eine Arbeitshypothese zum Begriff wissenschaftlicher 
Diskurs möglich wird, die eine minimale Schärfe besitzt. 


7 Empirische Theorie 


Für den Begriff einer empirischen Theorie werden folgende Annahmen gemacht: 

1. Eine empirische Theorie ist grundsätzlich ein Text, abgefasst in einer Sprache, 
die alle Beteiligten verstehen. 

2. Ein Teil des Textes enthält die Beschreibung einer Ausgangslage, deren Aus- 
sagen von den Theorie-Nutzern als jetzt zutreffend (wahr) oder jetzt nicht-zu- 
treffend (falsch) qualifiziert werden können. 

3. Ein anderer Teil enthält einen Text, der alle Veränderungen auflistet, die nach 
Wissen der Beteiligten im Kontext der Ausgangslage auftreten und Teile der 
Ausgangslage verändern können. 

4. Veränderungen in der Ausgangslage werden dadurch erreicht, dass bestimmte 
Aussagen der Ausgangslage durch andere Aussagen ersetzt werden, die in der 
Liste der möglichen Veränderungen angegeben werden. Der so entstehende 
neue Text ersetzt die bisherige Ausgangslage. Dieser Vorgang des Ersetzens von 
Aussagen wird hier Anwendung der Veränderungsregeln genannt.° 


5 Ein guter Einstieg kann sein: Frederick Suppe, „The Structure of Scientific Theories“, Critica, 
Bd. 11(31), 1977, 138-140. 

6 In der modernen Logik (und auch in der klassischen Logik) wird dieses Ersetzen Folgern genannt: 
mittels sogenannter Folgerungsregeln wird aus einer gegebenen Menge von Ausdrücken (bestehend 
aus Axiomen und Annahmen) ein Ausdruck abgeleitet (gefolgert). Während ein gefolgerter Ausdruck 
in der modernen Logik nichts Neues enthalten darf, repräsentieren Veränderungsregeln im Rahmen 
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NACHHALTIGE EMPIRISCHE THEORIE (NET) 
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Abbildung 2: Struktur und Prozessmodell zur Empirischen Theorie (ET) und zur Nachhaltigen Empiri- 
schen Theorie (NET). 


5. Durch die Möglichkeit, neue Ausgangslagen zu generieren, besteht die Mög- 
lichkeit, Voraussagen zu machen (Erwartungen auszubilden), indem auf eine 
zutreffende Ausgangslage nacheinander mehrfach (mindestens einmal) Ver- 
änderungsregeln angewendet werden. Die jeweils neu entstehenden Texte in- 
duzieren im Kopf der Beteiligten aufgrund der verfügbaren Bedeutungsfunk- 
tionen die Vorstellung einer Situation, von der man fordert, dass man sie in der 
intersubjektiven Realität als jetzt zutreffend qualifizieren kann, sollte sie ein- 
treten. Im Falle des Eintretens muss die Situation über die Wahrnehmung mit 
der Vorstellung im Kopf korrespondieren. Ob sich solch eine Korrespondenz 
herstellen lässt, nach wie langer Zeit und in welchem Umfang, dies ist in der 


einer empirischen Theorie generell etwas Neues im Vergleich zur Ausgangslage! Hier spiegelt sich 
ein fundamentaler Unterschied wider, der daher rührt, dass die reale Welt mit der ihr grundlegend 
zukommenden Eigenschaft der kontinuierlichen Veränderung nicht durch einfache Wiederholungen 
beschreibbar ist. 
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Gegenwart der Prognosenerstellung (der Bildung einer Erwartung) grundsätz- 
lich offen (Autonomie des Objekts!). 


8 Wissenschaftlicher Diskurs neu 


Noch vor der Einführung des Begriffs nachhaltige empirische Theorie erlaubt der 
soeben eingeführte Begriff einer empirischen Theorie erste Aussagen über das, was 
ein wissenschaftlicher Diskurs sein könnte beziehungsweise sein sollte. 

Es wird hier angenommen, dass die Beteiligten an einem wissenschaftlichen 
Diskurs ihre Meinung zur Welt in Form von Texten austauschen, die alle den An- 
forderungen einer empirischen Theorie genügen. 


9 Mit Menschen 


Sofern die Diskursteilnehmer Menschen sind, wissen wir, dass diese über grund- 
legende art-typische Fähigkeiten verfügen, mittels Sprache subjektive Bedeutungen 
zu generieren, die sich durch Bezug zu einer realen Situation als jetzt zutreffend oder 
als jetzt nicht-zutreffend entscheiden lassen. 


10 Mit Text-Generatoren 


Sofern die Diskursteilnehmer Text-Generatoren sind, denen diese elementaren 
Fähigkeiten (Bedeutung, Realitätsbezug) fehlen, fallen diese für einen wissen- 
schaftlichen Diskurs als selbständige Akteure aus. 

Zur Illustration hier eine Selbsteinschätzung von ChatGPT4, einem aktuellen 
Textgenerator: 


ChatGPT 

Yes, your summary of our previous dialogue is accurate based on the points you’ve listed: 

1. Icannot read a book in the same way a human does, meaning I don’t interpret or compre- 
hend in the same manner. 

2. My knowledge is up to September 2021, which means that I might not be aware of events, 
advancements, or publications after that point. 

3. My „learning“ is different from human learning. I don’t learn from new experiences or in- 
formation after my last update. Instead, I generate responses based on patterns in the data I 
was trained on. 
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4. I don’t cite individual sources in my responses. I provide information based on the patterns 
recognized during my training. 

5. Responses I give can vary slightly even if the same question is posed multiple times. 

6. Ican’t directly attribute my statements to specific, individual sources. 

7. The specifics about my training data and the processes that determine my responses are not 
transparently provided in each interaction. 

You’ve captured the essence of our prior conversation well. If you have further questions or need 

clarifications on any of these points, please let me know.’ 


Es stellt sich dann die Frage, ob aktuelle Text-Generatoren trotz ihrer stark limi- 
tierten Fahigkeiten dennoch einen Beitrag zu einem wissenschaftlichen Diskurs 
leisten könnten, und was dieser Beitrag für die menschlichen Teilnehmer bedeutet. 
Da Textgeneratoren für die harten wissenschaftlichen Kriterien (entscheidbarer 
Wirklichkeitsbezug, reproduzierbares Prognoseverhalten, Trennung von Quellen) 
ausfallen, kann man einen möglichen Beitrag nur innerhalb des menschlichen 
Verhaltens vermuten: Menschen sind prinzipiell in der Lage, einen Text von einem 
Textgenerator im Rahmen ihrer Überlegungen ansatzweise einzuordnen. Für die 
harte Theoriearbeit sind die Texte der Text-Generatoren zwar nicht nutzbar, aber 
aufgrund ihres literarisch-assoziativen Charakters quer über einen sehr großen 
Textbestand könnten die Texte von Text-Generatoren - im positiven Fall - mögli- 
cherweise über den Umweg des menschlichen Verstehens zumindest Gedanken in 
den Diskurs einspielen, die den menschlichen Benutzer dazu anregen, diese zu- 
sätzlichen Aspekte zu prüfen, ob sie vielleicht doch für die eigentliche Theoriebil- 
dung wichtig sein könnten.” Die Text-Generatoren würden auf diese Weise zwar 
nicht eigenständig am wissenschaftlichen Diskurs teilnehmen, aber indirekt als 
Hilfsmittel für die menschlichen Akteure, um deren Wissensprozess — eventuell — 
zu unterstützen. 


7 Dieser Text stammt von einem chat-Experiment des Autors mit ChatGPT4 vom 31. August 2023. Das 
Zitat findet sich in: Gerd Doeben-Henisch, „CONTINUE EXPERIMENT WITH CHATGPTA. Science, 
Empirical Science, Philosophy of Science“, uffmm, Integrating Engineering and the Human Factor, 
2023, in [https://tlp.de/3nw5e] (Zugriff: 27.09.2023). 

8 Eine ausführliche Illustration für diese assoziative Rolle eines Text-Generators findet sich 
ebenfalls in Doeben-Henisch 2023, am Beispiel des Begriffs Wissenschaftsphilosophie sowie zur 
Frage der Rolle von Wissenschaftsphilosophie. 
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11 Herausforderung Entscheidung 


Die Anwendung einer empirischen Theorie kann - im positiven Fall - ein erwei- 
tertes Bild der Alltagserfahrung ermöglichen, indem, bezogen auf eine Ausgangs- 
lage, mögliche Fortsetzungen (mögliche Zukünfte) vor Augen gestellt werden. 

Für Menschen, die ihre eigenen individuellen Prozesse in ihrem jeweiligen 
Alltag gestalten müssen, reicht es aber in der Regel nicht aus, nur zu wissen, was 
man tun kann. Vielmehr erfordert der Alltag, sich jeweils zu entscheiden, welche 
Fortsetzung man angesichts der vielen möglichen Fortsetzungen auswählt. Um sich 
im Alltag mit möglichst wenig Aufwand und mit — zumindest eingebildet — mög- 
lichst geringem Risiko behaupten zu können, haben Menschen für möglichst viele 
Alltagssituationen eingespielte Verhaltensmuster übernommen, denen sie spontan 
folgen, ohne sie jedes Mal neu zu hinterfragen. Diese eingespielten Verhaltens- 
muster beinhalten getroffene Entscheidungen. Dennoch gibt es immer wieder Si- 
tuationen, in denen die eingewöhnten Automatismen unterbrochen werden müs- 
sen, um die Frage bewusst zu klären, für welche von mehreren Möglichkeiten man 
sich entscheiden will.” 

Das Beispiel eines einzelnen Entscheiders kann man direkt auch auf das Ver- 
halten von größeren Gruppen übertragen. Hier spielen normalerweise noch mehr 
Einzelfaktoren eine Rolle, die alle integriert werden müssen, um zu einer Ent- 
scheidung zu kommen. Das charakteristische Merkmal einer Entscheidungssituation 
bleibt aber das gleiche: über welches Wissen man zum Entscheidungszeitpunkt 
auch verfügen mag, beim Vorliegen von Alternativen muss man sich für eine von 
vielen Alternativen entscheiden, ohne dass es an dieser Stelle ein weiteres, zusätzli- 
ches Wissen gibt. Die empirische Wissenschaft kann hier nicht helfen:*° Es ist un- 
abweislich eine Grundfähigkeit des Menschen, sich entscheiden zu können. Es 
bleibt bislang aber eher verborgen im Dunkel des Nichtwissens über sich selbst, was 
letztlich dazu führt, sich für das eine und nicht für das andere zu entscheiden. Ob 
und inwieweit die verschiedenen kulturellen Muster der Entscheidungshilfen in 
Form von religiösen, moralischen, ethischen oder ähnlichen Formaten in diesem 
Kontext eine hilfreiche Rolle für die Projektierung einer erfolgreichen Zukunft bilden 
oder gebildet haben, erscheint mehr denn je unklar zu sein. 


9 Die hier angedeutete Struktur der Entscheidungssituation hat Ähnlichkeiten mit dem Konzept 
‚System 1‘ in Daniel Kahnemann, Thinking Fast and Slow, UK 2012, dennoch sind der Kontext bei 
Kahnemann und der Kontext hier letztlich in einigen Punkten verschieden. 

10 Das ist auch dann noch der Fall, wenn sie noch so viele Details über das Format von Ent- 
scheidungsprozessen beisteuern kann. 
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12 Nachhaltige Empirische Theorie 


Durch die neu aufgeflammte Diskussion um Nachhaltigkeit im Kontext der Vereinten 
Nationen hat die Frage der überlebensrelevanten Priorisierung des Handelns einen 
spezifischen globalen Impuls erhalten. Die Vielzahl der Aspekte, die in diesem 
Diskurszusammenhang auftreten,’ lassen sich nur schwer bis gar nicht in einen 
übergreifenden, konsistenten begrifflichen Rahmen einordnen. Eine grobe Klassi- 
fizierung der Entwicklungsziele nach ressourcenorientiert und akteursorientiert 
kann helfen, eine zugrunde liegende Asymmetrie sichtbar zu machen: Ein Res- 
sourcenproblem gibt es nur, wenn es biologische System auf diesem Planeten gibt, 
die für ihre physische Existenz eine bestimmte Konfiguration von Ressourcen (ein 
Ökosystem) benötigen. Da die vorfindbaren physischen Ressourcen auf dem Planet 
Erde quantitativ begrenzt sind, lässt sich im Prinzip durch Denken und Wissen- 
schaft ermitteln, unter welchen Bedingungen die verfügbaren physischen Res- 
sourcen — bei einem vorherrschenden Verhalten — nicht ausreichend sind. Dazu 
kommt der Faktor, dass die biologischen Systeme durch ihre Existenz und ihr 
Verhalten die vorfindbaren Ressourcen aktiv verändern. Neben dem rein quanti- 
tativen Aspekt einer großen Zahl von Menschen soll hier das Augenmerk auf das 
Verhalten der biologischen Systeme gerichtet werden, das zu einem biologisch 
bedingten Mangel führen kann und de facto geführt hat. Insofern das Verhalten von 
biologischen Systemen im Fall der Art Homo sapiens sich durch innere Zustände 
steuern lässt, ist das Ressourcenproblem auch ein kognitives und emotionales 
Problem: Wissen wir genug? Wollen wir das Richtige? Und diese Fragen verweisen 
auf die Motivierung jenseits des aktuell Wissbaren. Gibt es hier einen dunklen Fleck 
im Selbstbild des Menschen? 

Einerseits verweist diese Fragestellung nach den treibenden Kräften für eine 
aktuelle Entscheidung über die Möglichkeiten der empirischen Wissenschaften 
hinaus (trans-empirisch, meta-physisch, ...), andererseits verweist diese Fragestel- 
lung aber auch ins Zentrum/in den Kern menschlicher Kompetenz. Dies motiviert 
dazu, den Begriff der empirischen Theorie zum Begriff einer nachhaltigen empi- 
rischen Theorie zu erweitern. Dies löst nicht automatisch die Frage nach dem in- 
neren Mechanismus einer Wertentscheidung, ordnet das Problem aber systema- 
tisch ein. Das Problem hat damit einen offiziellen Ort. 

Als Charakterisierung für das Konzept einer nachhaltigen empirischen Theorie 
wird folgende Formulierung vorgeschlagen (vgl. Abbildung 2): 

1. Eine nachhaltige empirische Theorie beinhaltet eine empirische Theorie als Kern. 


11 Beispielhaft seien die 17 Entwicklungsziele genannt, in [https:/unric.org/de/17ziele] (Zugriff: 
27.09.2023). 
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2. Neben den Teilen Ausgangslage, Veränderungsregeln und Anwendung von 
Veränderungsregeln enthält eine nachhaltige Theorie auch noch einen Text mit 
einer Liste von solchen Situationen, die als wünschenswert für eine mögliche 
Zukunft angesehen werden (Ziele, Visionen, ...). 

3. Unter Voraussetzung von Zielen kann man jede aktuelle Situation mit den 
verfügbaren Zielen minimal vergleichen und dadurch den Grad der Zielerrei- 
chung angeben. 


Die Angabe von erwünschten Zielen sagt nichts darüber aus, wie realistisch oder 
erfolgversprechend es ist, diese Ziele zu verfolgen. Es bringt nur zum Ausdruck, 
dass die Autoren dieser Theorie diese Ziele kennen und zum Zeitpunkt der Theorie- 
Erstellung für optimal halten.” Das Irrationale von gewählten Zielen wird auf diese 
Weise in den Denkbereich der Theorie-Ersteller offiziell einbezogen und erleichtert 
auf diese Weise die Ausdehnung des Rationalen auf das Irrationale, ohne dass man 
schon über eine echte Lösung verfügt. Niemand kann ausschließen, dass sich das 
Phänomen der Hervorbringung von Neuem beziehungsweise des Präferierens von 
einer bestimmten Sicht im Vergleich zu anderen zukünftig weiter und besser ver- 
stehen lässt. 


13 Erweiterter wissenschaftlicher Diskurs 


Akzeptiert man den Begriff einer nachhaltigen empirischen Theorie, dann kann man 
damit den Begriff eines wissenschaftlichen Diskurses dahingehend erweitern, dass 
nicht nur Texte eingebracht werden können, die empirische Theorien repräsen- 
tieren, sondern auch solche Texte, die nachhaltige empirische Theorien mit eigenen 
Zielen repräsentieren. 

Auch hier kann man die Frage stellen, ob die aktuellen Text-Generatoren einen 
konstruktiven Beitrag leisten können. 

Insofern eine nachhaltige empirische Theorie eine empirische Theorie als 
harten Kern enthält, gelten die vorausgehenden Feststellungen zur Begrenztheit 
von Text-Generatoren. Sie können allerdings — wie festgestellt - im kreativen Teil 
der Entwicklung einer empirischen Theorie durch ihren assoziativ-kombinatori- 
schen Charakter auf der Basis einer sehr großen Zahl von Dokumenten Textfrag- 


12 Als optimal kann nur etwas klassifiziert werden, was sich in einen übergreifenden Rahmen 
einordnen lässt, welcher Positionierung in einer Skala zulässt. Dies verweist auf ein minimales 
kognitives Modell als Ausdruck von Rationalität. Die Entscheidung selbst aber findet außerhalb 
eines solchen rationalen Modells statt; die Entscheidung als eigenständiger Prozess ist in diesem 
Sinne vor-rational. 
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mente einspielen, die die aktiven menschlichen Theorie-Autoren möglicherweise 
anregen können, ihr Blickfeld zu erweitern. 

Was aber ist mit jenem Anteil, der sich in der Auswahl von möglichen Zielen 
manifestiert? 

An dieser Stelle muss man sich bewusst machen, dass es bei den Ziel-Texten 
nicht um irgendwelche Formulierungen geht, sondern um solche, die innerhalb eines 
systematischen Rahmens mögliche Lösungsformulierungen darstellen; dies impli- 
ziert die Kenntnis von relevanten und überprüfbaren Bedeutungsstrukturen, die im 
Kontext der symbolischen Muster berücksichtigt werden müssten. Über diese Fä- 
higkeiten verfügen die Text-Generatoren grundsätzlich nicht. Aber es ist — wie- 
derum - nicht auszuschließen, dass ihr assoziativ-kombinatorischer Charakter auf 
der Basis einer sehr großen Zahl von Dokumenten nicht doch die eine oder andere 
Anregung liefern kann. 


14 Die Herausforderungen einer dynamischen 
Umwelt 


Die beiden Konzepte Empirische Theorie und Nachhaltige Empirische Theorie kann 
man verstehen als denkerischen Reflex auf die dynamische Grundverfasstheit der 
empirischen Welt, die im Kern aus Veränderungen besteht, die ein lineares Zeit- 
modell implizieren, in dem es ein Vorher und ein Nachher gibt. Aus der grundlegend 
gerichteten Dynamik folgt, dass eine jeweilige Gegenwart niemals nur aus der 
Wiederholung der Vergangenheit rekonstruiert werden kann. Der Anteil von Neuem 
als Teil einer aktuellen Gegenwart muss bezogen auf das Vorher als real größer Null 
angenommen werden. Aus diesen Annahmen folgt ferner, dass die mögliche Zu- 
kunft grundlegend offen ist; man kann sie nicht vorwegnehmen. Eine bloße Wie- 
derholung des schon Bekannten (des Alten) reicht nicht aus, um dem Geschehen in 
der realen Welt gerecht zu werden." 

Um sich in einer solchen dynamischen Welt mit realen Veränderungen und 
offenem Ausgang behaupten — oder gar entwickeln — zu können, braucht es Sys- 
teme, die grundlegend adaptiv und zugleich zuverlässig (nachhaltig) sein können. 
Die Realität von unterschiedlichen Veränderungsgeschwindigkeiten bietet zwi- 
schen ganz kurz und scheinbar unendlich lang eine Bandbreite, die mit der Zeit- 
wahrnehmung und dem Verhalten eines einzelnen Menschen in keiner Weise 
harmoniert. Ohne technische Hilfsmittel, ohne effektives kollektives Zusammen- 


13 Eine gute Einführung in das Thema Zeit finde sich in Gerald James Whitrow, The Natural Phi- 
losophy of Time, Oxford 71980. 
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wirken, und dies über viele Generationen hinweg, sind wir Menschen nicht in der 
Lage, dieser dynamischen Umgebung gerecht zu werden. 


15 Meta-Diskurs als wissenschaftlicher Diskurs. 
Bildung einer Super-Theorie? 


Mit Hilfe der Konzepte Empirische Theorie (ET) und Nachhaltige Empirische Theorie 
(NET) verfügt man über die Möglichkeit, das Konzept Wissenschaftlicher Diskurs zu 
normieren. Mit Blick auf das Struktur-Konzept, das sich in transdisziplinärer und 
dann ganz generell in wissenschaftsphilosophischer Perspektive ergibt (vgl. Abbil- 
dung 1), kann man die Frage stellen, ob dieser erweiterte Diskurs-Kontext auch 
noch zum wissenschaftlichen Diskurs zu zählen ist? 

Im vorliegenden Text wird als Kern eines wissenschaftlichen Diskurses - trotz 
aller zusätzlichen unterstützenden begrifflichen Strukturbildungen - die finale 
Rückführbarkeit auf empirische Geltung angesehen. 

In einem Meta-Diskurs werden die Begrifflichkeiten einzelner empirischer 
Disziplinen in einem ersten Schritt auf eine sprachliche Meta-Ebene projiziert. Bei 
korrektem Vorgehen bleibt dabei die Struktur und die Aussage der jeweiligen 
Einzeldisziplinen erhalten. Spannend wird es dann im zweiten Schritt, wenn auf 
der Meta-Ebene die Strukturen der einzelnen Disziplinen zum Objekt werden und 
ihre Eigenschaften im Vergleich mit den anderen Disziplinen untersucht werden. 
Durch diese Analysen kann es sehr wohl geschehen, dass zwischen verschiedenen 
einzelnen Disziplinen Strukturähnlichkeiten entdeckt werden, die es möglich ma- 
chen, diese Disziplinen auf einer höheren Ebene zu vereinheitlichen, ohne dabei aber 
ihre Besonderheiten aufzuheben. Letztlich versucht das Projekt einer transdiszipli- 
nären Analyse alle bekannten Einzeldisziplinen auf diese Weise in einen einzigen 
begrifflichen Rahmen so zu integrieren, dass die Zusammenhänge sichtbar werden 
bei vollständigem Erhalt der individuellen Besonderheiten. 

In diesem Format einer transdisziplinären Analyse würde ein umfassender 
Meta-Diskurs seinen empirischen Kern nicht nur nicht verlieren, sondern die 
verschiedenen empirischen Kerne würden durch Einbettung in größere Zusam- 
menhänge potentiell an Aussagekraft gewinnen. Ein Meta-Diskurs eröffnet letztlich 
die Möglichkeit zur Entstehung einer Super-Theorie. Eine solche Super-Theorie ist 
durch und durch nur als kollektive Leistung aller möglich. 
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16 Kollektive Mensch-Maschine Intelligenz? 


Abschließend soll noch auf die Frage eingegangen werden, wo im Raum des skiz- 
zierten Meta-Diskurses Platz für das Phänomen einer kollektiven Intelligenz sein 
könnte, weiter spezifiziert zu kollektiver Mensch-Maschine Intelligenz. 

Dazu sei angemerkt, dass der Begriff der Intelligenz als solcher auch heute alles 
andere als klar ist. In der philosophischen und wissenschaftlichen Geschichte ist 
der Begriff Intelligenz eingebettet in vielfältige Begriffsnetzwerke, die partiell 
Überschneidungen aufweisen, weitgehend aber einfach disparat sind.'* 

Zu beachten ist, dass die neue Disziplin Computerwissenschaft (Informatik), die 
in ihren Kerndisziplinen Berechenbarkeit, Automaten und Formale Sprachen ur- 
sprünglich weder den Begriff der Intelligenz brauchte noch von sich aus einen 
solchen anbieten konnte, dennoch schon sehr früh begann, verschiedene Versionen 
des Begriffs Intelligenz zu benutzen. Zunächst eher metaphorisch wurde der Begriff 
der Intelligenz dann aber mit immer mehr Verhaltensleistungen von Algorithmen 
korreliert, ohne dass der ursprünglichen Bedeutung des Intelligenzbegriffs in an- 
deren wissenschaftlichen Disziplinen besondere Beachtung zuteilwurde.'° 

Hervorstechend ist aber, dass der Begriff der Intelligenz lange Zeit fast aus- 
schließlich am Beispiel individueller Systeme untersucht wurde. Erst in den letzten 
Jahrzehnten gewann der Begriff Kollektive Intelligenz mehr Raum. Aber auch hier 


14 Ein möglicher Einstieg in diesen Sachverhalt findet sich bei Luigi Pastore, „Intelligenz“, in En- 
zyklopädie Philosophie, hg. von Hans Jörg Sandkühler, Bd. 2, Hamburg 2010, 1120-1126. 

15 Mögliche Kostproben aus unterschiedlichen Zeiten: Elaine Rich, Artificial Intelligence, New York 
et al. 1983 (benutzt den Begriff ‚Intelligence‘ nicht); Nils J. Nilsson, Artificial Intelligence. A new 
Synthesis, San Francisco 1998 (benutzt den Begriff des ‚intelligenten Verhaltens‘); Günther Görz/ 
Claus-Rainer Rollinger/Josef Schneeberger (Hg), Handbuch der künstlichen Intelligenz, München/ 
Wien “2003 (in diesem Handbuch findet sich eine sehr ausführliche Einleitung zur Geschichte der 
Entwicklung der Künstlichen Intelligenz, in der auch explizit Bezugnahmen zur menschlichen In- 
telligenz vorkommen. Im Resümee kommen die Autoren aber nicht um die Feststellung herum, dass 
bislang kein einzelner Ansatz eine Perspektive geboten hat, mit der sich alle Aspekte intelligenten 
Verhaltens reproduzieren oder erklären lassen, vgl. 14); Stuart Russell/Peter Norvig, Artificial In- 
telligence: A Modern Approach, Boston et al. 32016, 4. Edition in [https://aima.cs.berkeley.edu/] (Zu- 
griff: 14.10.2023) (In diesem — mittlerweile wohl als Standard akzeptierten Lehrbuch für künstliche 
Intelligenz — wird die Einführung zum Thema künstliche Intelligenz erheblich ausgeweitet sowohl 
in Richtung Geschichte wie auch unter Berücksichtigung einer Vielzahl von Disziplinen, die alle 
irgendwie zum Thema in Beziehung stehen. Aber auch hier findet man nicht die Definition von 
Intelligenz. Die Autoren haben sich vielmehr dafür entschieden, ein Paradigma auszuwählen, in- 
nerhalb dessen sie die Vielzahl der Ideen und Beiträge einordnen wollen. Sie beschreiben das 
Konzept eines intelligent agent, der grundsätzlich lernfähig ist, und dem Rationalität unterstellt 
wird. Sofern von Intelligenz die Rede ist, wird diese in diesem Kontext lokalisiert, vgl. viii und 29-30). 
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reproduziert sich eine Vielfalt von Charakterisierungen jener Phänomene, die man 
als kollektive Intelligenz verstehen will." 

Als sogenannte Intelligenzleistungen gelten im Kern statische Aufgabenstellun- 
gen, in denen überprüft werden kann, ob ein Akteur in einer bestimmten Zeit nach 
einem vereinbarten Auswertungskriterium diese Aufgaben lösen kann oder nicht. 
Diese Aufgaben können so vielfältig sein, wie diese Welt vielfältige Situationen 
bereitstellen kann, und diese können sich im Laufe der Zeit ändern, so, wie sich 
auch das kulturelle Lösungswissen ändern kann. Für sich alleine genommen hat 
solch ein isoliertes Lösungsgeschehen keine besondere Bedeutung. 

Es drängt sich daher die Frage auf, ob man auf den Begriff der Intelligenz heute 
nicht einfach verzichten sollte. Der Bedeutungswert des Begriffs Intelligenz tendiert 
sowohl im Sinne von Shannon” wie auch im Kontext einer allgemeinen Bedeu- 
tungsfunktion mittlerweile gegen Null. 

Doch woran sollte man sich dann orientieren? 

Nimmt man die grundlegenden Eigenschaften der realen Welt ernst, ihre reale 
Veränderlichkeit, die gerichtete Veränderungszeit, und erinnert man sich daran, 
dass die Menschen als biologische Systeme nur durch gezielten Einsatz von Technik 
zur Veränderungserfassung, durch kollektive begriffliche Leistungen zur Integra- 
tion der vielfältigen Aspekte der Welt (einschließlich ihrer selbst) und durch kol- 
lektives Zusammenwirken über längere Zeiträume hinweg (auch über hunderte von 
Jahren) in der Lage sind, ihre Chance auf ein Weiterleben auf diesem Planeten der 
steten Veränderung zumindest ansatzweise zu wahren, dann empfiehlt es sich, 
künftig eher im Paradigma einer transdisziplinär orientierten Meta-Theorie zu 
denken, die von einer Population adaptiver Akteure benutzt wird. In diesem Rah- 
men gibt es genügend Herausforderungen in Form von thematisch-lokalen Aufga- 
benfeldern, bei denen sich der Einsatz von maschinellen Prozeduren zur Bewälti- 
gung dieser Aufgaben lohnen würde, vielleicht sogar in einem existenziellen Sinne: 
Ohne Technik werden sich viele Aufgaben nicht einlösen lassen, selbst wenn wir die 
Aufgabe selbst denkerisch erschließen können. 


16 Hilfreiche Einstiege: Charles R. Gallistel, The Organization of Learning, Boston 1990; Nicholas 
Mackintosh (Hg.), Animal Learning and Cognition, San Diego et al. 1994; Pierre Lévy, Die kollektive 
Intelligenz. Für eine Anthropologie des Cyberspace, Mannheim 1997; Peter Kappeler, Verhaltensbio- 
logie, Berlin et al. 2006; Thomas W. Malone/Michael S. Bernstein (Hg.), Handbook of Collective In- 
telligence, Boston 2015. 

17 Claude E. Shannon/Warren Weaver, The Mathematical Theory of Communication, Urbana 101964 
[1949], 8 ff. 
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17 Das Biologische 


Der Hotspot für real Neues auf dem Planet Erde - und letztlich vielleicht sogar für 
das gesamte Universum - ist das Biologische, von dem der Homo sapiens ein ge- 
nuiner Teil ist. Es könnte sinnvoll sein, sich diesem genuin Neuen etwas mehr zu 
widmen als bisher. 

Das Neue ist der Schlüssel zur Zukunft. 


Christian Stöcker 
Lernende Maschinen und die Zukunft der 
Offentlichkeit 


Abstract: Machine learning systems, now often referred to as artificial intelligence 
or Al systems, have been instrumental in shaping the public sphere for at least two 
decades. The advent of search engines, and, a few years later, algorithmically cu- 
rated social media sites, has created a new information ecosystem with substanti- 
ally different properties than the legacy media system based mainly on newspapers, 
radio, and television. Not all of these characteristics are desirable from a normative 
point of view. For example: Ample research shows that mis- and disinformation 
have a strategic advantage compared to factually correct information in social 
media environments. The advent of generative machine learning systems that can 
create realistic text, images, and increasingly also audio and video content will 
exacerbate this problem: the marginal cost for creating convincing disinformation 
at scale is dropping rapidly. This article cites some examples that have already been 
observed and discusses possible mediation strategies. 


1 Einleitung 


Seit vielen Jahren wird das Zusammenspiel von kommerziell und politisch moti- 
vierter Desinformation, Propaganda und Misinformation sowie die Rolle, die On- 
line-Plattformen und Social-Media-Plattformen bei der Verbreitung solcher Inhalte 
spielen, intensiv erforscht. Die Verbreitung von sogenannten „Fake News“ während 
des US-Präsidentschaftswahlkampfs 2016' wurde als ein möglicher Faktor für den 
Ausgang der Wahl diskutiert. Auch wenn die Debatte über die Auswirkungen sol- 
cher Inhalte auf das tatsächliche Wahlverhalten noch immer umstritten ist,” steht 


1 Siehe z.B. Claudia Eva Schmid et al., „Der strategische Einsatz von Fake News zur Propaganda im 
Wahlkampf“, in Fake News, Hashtags & Social Bots, hg. von Klaus Sachs-Hombach/Bernd Zywietz, 
Wiesbaden 2018, 69-95; Hunt Allcott/Matthew Gentzkow, „Social Media and Fake News in the 2016 
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fest, dass diese Art von Inhalten heute ein Publikum erreicht, das vor dem Auf- 
kommen des Internets als Massenmedium nicht erreicht werden konnte.” 

Es gibt zahlreiche Belege dafür, dass radikale und extremistische Gruppen die 
neuen Mittel zur Erreichung eines Publikums nutzen, um Mitglieder und Sympa- 
thisanten zu rekrutieren.* 

Ein wichtiger Aspekt dieses neuen medialen Ökosystems sind die Empfeh- 
lungssysteme, sogenannte Recommender Systems, landläufig häufig einfach „Algo- 
rithmen“ genannt. Sowohl Suchmaschinen als auch Social-Media-Plattformen nut- 
zen derartige Systeme, um Ergebnisse und Inhaltsströme zu personalisieren und die 
damit gewonnene Aufmerksamkeit des Publikums zu monetarisieren.° In zuneh- 
mendem Maße stützen sich Empfehlungssysteme zur Optimierung auf maschinelles 
Lernen.‘ 

Dies trifft auch auf die meistbesuchten Websites der Welt zu.’ Dazu gehören die 
meistgenutzte Suchmaschine, Google (über 3,5 Milliarden Suchanfragen pro Tag im 
Jahr 2019,° Marktanteil 90% oder mehr, je nach verwendeter Methode),’ das nach 
wie vor weltweit größte soziale Netzwerk Facebook (fast drei Milliarden monatlich 
aktive Nutzer*innen im Jahr 2023) und die weltweit größte Videoplattform YouTube 
(über 2,5 Milliarden monatlich aktive Nutzer*innen im Jahr 2023).’° Dazu kommen 
neuere, schnell wachsende Plattformen wie TikTok (eine Milliarde monatlich aktive 


3 Siehe z.B. Christoph Neuberger et al., „Googleisierung‘ oder neue Quellen im Netz?“, in Journa- 
lismus im Internet. Profession - Partizipation — Technisierung, hg. von Christoph Neuberger/Chris- 
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rican Academy of Political and Social Science, Bd. 668(1), 2016, 165-179; Robin Thompson, „Radic- 
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Ricci et al., New York et al. 2011. 
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10.1145/2959100.2959190). 
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Nutzer*innen im Jahr 2023),' die ebenfalls auf maschinell kuratierte und perso- 
nalisierte Inhalte-Feeds setzen. 

Zusammen sind derartige Plattformen für einen erheblichen Teil der Zeit und 
Aufmerksamkeit verantwortlich, die Internetnutzer*innen jeden Tag online inves- 
tieren. Die Art und Weise, wie die Inhalte gefiltert und sortiert werden, ist daher für 
die öffentliche Wahrnehmung, die Gestaltung und die Diskussion von Themen, wie 
Politik oder beispielsweise die Einstellung zu medizinischen Behandlungen wie 
Impfungen, von Bedeutung. Der Kommunikationswissenschaftler Philip Napoli hat 
diese neuen Gatekeeper als „automatisierte Medien“ bezeichnet”” und betont, dass 
die Nachrichtenproduktion’® wie auch die Nachrichtenauswahl'* zunehmend auf 
Instrumente der automatisierten Entscheidungsfindung (auch ADM-Systeme ge- 
nannt) zurückgreifen, die häufig Komponenten maschinellen Lernens enthalten 
und ständig optimiert werden. 

Mittlerweile gibt es zahlreiche empirische Belege, dass die Metriken und Si- 
gnale, die diese Unternehmen für Ranking-Entscheidungen und Inhaltsempfeh- 
lungen auf ihren Websites und in ihren Apps verwenden, dazu beitragen können, 
dass Inhalte ein Publikum erreichen, welche bewusst negative Emotionen erregen, 
irreführend sind oder gezielte Propaganda enthalten." Dies ist eine Folge einer 
komplexen Wechselwirkung der Empfehlungssysteme selbst, die für Ranking- und 
Empfehlungsentscheidungen verwendet werden, mit anderen Faktoren wie der 
Wahrscheinlichkeit, dass sich bestimmte Arten von Nutzern mit Online-Medien- 
inhalten beschäftigen, kognitiven Mechanismen auf der Nutzer*innenseite und der 
Gestaltung von Benutzeroberflächen.'® Tatsächlich lässt sich in Simulationen zei- 
gen, dass etwa ein Empfehlungssystem wie jenes, das YouTube einsetzt, zwangs- 
läufig immer auch unangemessene Inhalte empfiehlt, und dass diese Art von Feh- 


11 Ebd. 

12 Philip Napoli, „Automated Media: An Institutional Theory Perspective on Algorithmic Media 
Production and Consumption: Automated Media“, Communication Theory, Bd. 24(3), 2014, 340-360. 
13 Philip Napoli, „On Automation in Media Industries: Integrating Algorithmic Media Production 
into Media Industries Scholarship“, Media Industries, Bd. 1(1), 2014, 33-38. 

14 Philip Napoli, „Social media and the public interest: Governance of news platforms in the realm 
of individual and algorithmic gatekeepers“, Telecommunications Policy, Bd. 39, 2015, 751-760. 

15 Christian Stöcker, „How Facebook and Google Accidentally Created a Perfect Ecosystem for 
Targeted Disinformation“, in Disinformation in Open Online Media. First Multidisciplinary Inter- 
national Symposium, MISDOOM 2019, Hamburg, Germany, February 27 - March 1, 2019, Revised 
Selected Papers, hg. von Christian Grimme et al., Cham 2020, 129-149. 

16 Konrad Lischka/Christian Stöcker, Digitale Öffentlichkeit. Wie algorithmische Prozesse den ge- 
sellschaftlichen Diskurs beeinflussen. Arbeitspapier, Gütersloh 2017. 


404 —— Christian Stöcker 


lern im Laufe längerer „Viewing Sessions“ tendenziell zunehmen.!’ Dies ist eine 
Folge der Mechanismen der lernenden Systeme, die zur Inhaltempfehlung einge- 
setzt werden. 


2 Relevanz auf algorithmisch kuratierten 
Plattformen 


Die Auswahl- und Kuratierungskriterien der großen Plattformen unterscheiden 
sich deutlich von denen etwa von Journalist*innen. Das liegt daran, dass sie auf die 
Optimierung bestimmter Metriken abzielen, die nicht nur den Nutzen für den 
einzelnen Nutzenden, sondern auch die Monetarisierungsmöglichkeiten der Platt- 
formen maximieren sollen. Für Facebook beispielsweise besteht das zentrale Op- 
timierungsziel in der Maximierung des Engagements, einer hybriden Kennzahl, die 
sich aus den verschiedenen Möglichkeiten zusammensetzt, wie Nutzer*innen mit 
Inhalten auf Facebook interagieren können. 
Das Engagement wird berechnet durch die Kombination von:"* 

— den sogenannten Reactions, mit denen ein*e bestimmte*r Nutzer*in und alle 
Facebook-Nutzer*innen insgesamt auf einen bestimmten Inhalt reagieren. 
Reactions bedeutet hier: Klicks auf den Like-Button oder andere Optionen wie 
ein lachendes Emoji und ein wütendes Emoji usw; 

- der Anzahl der Shares, d.h. die Häufigkeit, mit der einzelne Nutzer*innen einen 
bestimmten Inhalt, auf den sie auf Facebook gestoßen sind, mit ihrem Online- 
Kontaktkreis innerhalb der Plattform teilen, indem sie die dazu eingebaute 
Funktionalität nutzen; 

— der Anzahl der Kommentare zu einem bestimmten Inhalt, d.h. die Anzahl der 
individuellen verbalen Reaktionen. 


Das Engagement ist also ein zusammengesetztes Maß für die Anzahl der Reaktio- 
nen, die irgendeine Form von persönlicher Aktivität seitens der Nutzer*innen er- 
fordern. Die tatsächlichen Nutzer*innen und anderen Signale, die in Facebooks 
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Kuratierungssysteme eingespeist werden, um den personalisierten Newsfeed aller 
Nutzer*innen zu kuratieren, sind jedoch viel zahlreicher. 

Sowohl für Facebook als auch für Twitter/X, ein weiteres soziales Netzwerk, hat 
sich gezeigt, dass Inhalte mit einer hohen emotionalen, insbesondere einer negativ 
konnotierten emotionalen Valenz höhere Reaktionsraten bei anderen Nutzer*in- 
nen hervorrufen.’ Die Frage, welche Rolle die emotionale Valenz in diesem Zu- 
sammenhang spielt, ist nicht ganz so eindeutig, wie diese beiden Ergebnisse ver- 
muten lassen, aber eine große Anzahl von Studien mit unterschiedlichen Methoden, 
die sich mit verschiedenen Plattformen und verschiedenen Arten von Inhalten 
befassten, zeigt, dass emotional aufgeladene Inhalte tendenziell mehr Engagement 
in sozialen Medien und anderen in großen Gruppen genutzten Online-Kommuni- 
kationssystemen hervorrufen.” 

Die Optimierungsmaße unterscheiden sich von Plattform zu Plattform, aber in 
vielen Fällen haben sie ähnliche Auswirkungen: Sie verschaffen problematischen, 
irreführenden oder besonders stark emotionalisierenden Inhalten besonders hohe 
Reichweite.” Maße wie Verweildauer, Watch Time und Interaktionsrate sind 
wichtige Optimierungsziele, weil Interaktionen einerseits stets zusätzliche Daten 
über die Nutzer*innen liefern, die man wiederum zur noch passgenaueren Aus- 
lieferung von Werbung auswerten kann, und andererseits jeder Klick und jeder 
Kommentar neue Inhalte erzeugt, die wiederum das Interesse anderer Nutzer*in- 
nen wecken und damit deren Verweildauer erhöhen können. In jedem Fall sind 
diese Relevanzkriterien deutlich anders als jene, die in journalistisch arbeitenden 
Redaktionen zur Anwendung kommen. 


3 Relevanz, journalistisch betrachtet 


In der Publizistik. und Kommunikationswissenschaft existiert schon seit hundert 
Jahren das Konzept des Nachrichtenwertes (news value). Der erste Autor, der eine 
Systematisierung solcher Merkmale journalistischer Themen entwarf, war der US- 
amerikanische Journalist und Autor Walter Lippman. In seinem Buch Die öffentli- 
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che Meinung, im Original von 1922,” findet sich die erste Liste mit Faktoren, die sich 
auf die journalistische Relevanz eines Themas auswirken sollten, darunter die Be- 
kanntheit der beteiligten Personen, die räumliche Nähe eines Ereignisses, der 
Überraschungswert eines Ereignisses, wie sensationell und wie langanhaltend das 
Ereignis ist. Auf Basis des Begriffs news value entwickelte sich die sogenannte 
Nachrichtenwerttheorie.” 

Ausrichtung und Selbstverständnis des jeweiligen Mediums entscheiden über 
die Gewichtung solcher Faktoren. Bei Meldungen etwa aus Politik und Wirtschaft 
steht demnach Bedeutung und Reichweite im Vordergrund. Das vermutete Publi- 
kumsinteresse spielt eher bei Meldungen über Prominente oder andere Bericht- 
erstattung, die zumindest teilweise unterhaltenden Charakter hat, eine wichtigere 
Rolle. 

Die Gewichtung der einzelnen Nachrichtenfaktoren ist dabei variabel: Eher 
dem Boulevardjournalismus zuzuordnende Publikationen legen mehr Wert auf 
emotionalisierende Inhalte, andere Redaktionen achten möglicherweise auf Be- 
deutung und Reichweite eines Nachrichtenereignisses. Wenn Sie sich an den Ver- 
haltenskodizes für Pressebericherstattung orientieren, sollten Redaktionen bei der 
Berichterstattung in jedem Fall um Wahrhaftigkeit und Faktentreue bemüht sein. 
Zu diesem Zweck existieren Standards des journalistischen Handwerks wie die 
sorgfältige Prüfung von Quellen und Fakten, die Suche nach mehreren Quellen für 
strittige Behauptungen, die Abbildung aller Seiten eines Konfliktes und so weiter. 
Emotionalisierende Desinformation genügt daher in mehrfacher Hinsicht nicht 
journalistischen Standards. 


4 Die Relevanzkriterien der Plattformbetreiber 
haben Nebenwirkungen 


Die Gewichtung der Nachrichtenfaktoren und damit die Einstufung der Relevanz 


von aktuellen Ereignissen und Neuigkeiten in Redaktionen ist eher implizit als 
explizit” und verändert sich zudem womöglich über die Zeit.” Auch in Bezug auf 
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klassische journalistische Inhalte wurde bereits gezeigt, dass das, was heute als ein 
Aspekt von Engagement betrachtet wird, das aktive Weiterleiten von Nachrichten- 
inhalten, im Zusammenhang mit der emotionalen Valenz der Inhalte steht. Eine der 
meistzitierten Studien zur Rolle von Emotionen in den sozialen Medien basiert 
nicht auf Daten von Twitter oder Facebook, sondern auf der Auswertung von E-Mail- 
Empfehlungen: Jonah Berger und Katherine Milkman werteten im Jahr 2009 für 
einen Zeitraum von drei Monaten aus, welche auf der Website der New York Times 
publizierten Artikel besonders häufig per E-Mail weiterempfohlen wurden. Dabei 
stellten die Wissenschaftler fest, dass Emotion für diese Art von digital-medialer 
Verbreitung eine wichtige Rolle spielte:”° Artikel, die die Autoren mit Hilfe ma- 
schineller Verfahren als ärger-, ehrfurchts- oder angstauslösend eingestuft hatten, 
wurden besonders häufig per E-Mail weitergereicht. Weil diese Funktion als eine 
Art Vorläufer der Share-Funktion etwa von Facebook angesehen wird, gilt dieses 
Resultat als einer der ersten Hinweise auf die Bedeutung von Emotionalität für die 
virale Verbreitung von Inhalten über soziale Medien. 

Festzuhalten bleibt: Die Nachrichtenfaktoren, also die Auswahlkriterien jour- 
nalistisch arbeitender Redaktionen, unterscheiden sich deutlich von den Optimie- 
rungsmaßen von Suchmaschinen und Social-Media-Plattformen.”’ Engagement 
(Facebook), Watch Time (YouTube), Dwell Time (Google) und ähnliche Maße be- 
werten Relevanz nach rein deskriptiven Kriterien: Welcher Inhalt erzeugt wieviel 
Aufmerksamkeitszeit, wieviel Interaktion? Kriterien wie Qualität, Wahrhaftigkeit, 
Faktizität oder Ausgewogenheit spielen dabei keine Rolle. 

Dieser Umstand wiederum verschafft Desinformation einen Vorteil: Weil sie 
sich nicht an störende Einschränkungen wie Faktentreue oder Ausgewogenheit 
halten muss, kann Desinformation so aufregend, wütend machend, emotionalisie- 
rend sein, wie es für maximale Reichweite dienlich scheint. Mit Erfolg: „Falsehood 
diffused significantly farther, faster, deeper, and more broadly than the truth in all 
categories of information.“ Das zeigten Vosoughi und Kolleg*innen in einer 2018 in 
Science veröffentlichten Studie über die Verbreitung von Information und Desin- 
formation auf Twitter. Auf konkrete Nachrichtenthemen bezogen, von Angela 
Merkel über rechtsextreme Ausschreitungen in Chemnitz bis hin zu Impf-Desin- 
formation, lassen sich derartige Effekte ebenso für Facebook, YouTube und Google 
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nachweisen.” Die Plattformbetreiber haben gewissermaßen versehentlich sehr 
effektive Ökosysteme für die Verbreitung von Desinformation geschaffen. 

Es bleibt oft unklar, wie stark die konkreten Auswirkungen dieser geänderten 
Lage auf reale Entscheidungen des Publikums wirken, etwa im Hinblick auf das 
Wahlverhalten. Dass Desinformation auf die Dauer nicht folgenlos bleibt, zeigen 
allerdings Phänomene wie die Tatsache, dass Menschen, die Desinformation über 
einen angeblichen Zusammenhang zwischen Impfungen in der Kindheit und Au- 
tismus für wahr halten, ihre Kinder häufiger nicht impfen lassen. Das hat wiederum 
konkrete gesellschaftliche Auswirkungen und führte beispielsweise zu „einem 
merklichen Anstieg von durch Impfungen vermeidbaren Erkrankungen“. Desin- 
formation hat also unzweifelhaft negative gesellschaftliche Auswirkungen. Ihre 
Verbreitung so weit wie möglich einzudämmen, ist ein erstrebenswertes Ziel. 


5 Generative KI-Systeme und die mediale 
Öffentlichkeit 


Diese neue mediale Öffentlichkeit ist, wie oben angesprochen, in Teilen nach an- 
deren Relevanzkriterien und durch andere Mechanismen organisiert als die Ha- 
bermas’sche „Bürgerliche Öffentlichkeit“! deren Diskurse über klassische Mas- 
senmedien vermittelt wurden. In diese Situation treten nun als zusätzliche Faktoren 
weitere Entwicklungen, die die digitale Medienproduktion und -rezeption weiter 
verändern. Im Kontext dieses Tagungsbandes sind damit vor allem Text-, aber auch 
Bild- und Videogeneratoren gemeint, die auf Systemen maschinellen Lernens ba- 
sieren, kurz häufig als „künstliche Intelligenz“ (KI) bezeichnet. Systeme zur auto- 
matisierten Erstellung oder Ergänzung von Texten wie ChatGPT von dem US-Un- 


ternehmen OpenAl,”” Llama von dem US-Unternehmen Meta, ehemals Facebook,” 
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oder Googles Bard** können auf Basis sehr großer künstlicher neuronaler Netze, die 
mit sehr großen Mengen von Trainingsdaten gefüttert wurden, Texte produzieren, 
die von menschlichen Hervorbringungen nicht mehr zu unterscheiden sind, und 
das in mehreren Sprachen. Bildproduktionssysteme wie die kommerziellen Syste- 
me Dall-e 3 von OpenAI,” Midjourney”° oder das Open-Source-Projekt Stable Dif- 
fusion?” von Stability AI erzeugen Bilder, die oft ebenfalls nicht mehr von 
menschlichen Werken zu unterscheiden sind und unter Umständen wirken wie 
Fotografien realer Szenen. Auch KI-basierte Systeme zur Produktion oder Modifi- 
kation von Audio- und Bewegtbildsequenzen existieren bereits.” Die Imitation 
menschlicher Stimmen durch KI-Systeme ist bereits sehr weit fortgeschritten”? 

Derartige Systeme werden in vielen Bereichen längst eingesetzt, um Inhalte für 
ein großes Publikum zu generieren, manchmal in informierender oder unterhal- 
tender, manchmal aber auch bereits jetzt in eindeutig desinformierender Absicht. 
Im Folgenden werden einige Beispiele genannt. 


5.1 Text- und Bildgeneratoren im Journalismus 


Der deutsche Zeitungsverlag Ippen Media beispielsweise hatte nach Angaben seines 
Digital-Chefredakteurs Markus Knall schon im April 2023 „mehrere hundert Bei- 
träge“ publiziert, „die in irgendeiner Weise KI unterstützt hat“, wie er in einem 
Interview mit dem Magazin des Deutschen Journalisten-Verbands (DJV) erklarte.*° 
Knall musste in dem Gespräch auch zu einem Fall Stellung nehmen, in dem ein KI- 
generierter Text eine durchaus wesentliche Fehlinformation enthielt, was erst nach 
Hinweisen eines Kollegen aus einer anderen Redaktion korrigiert wurde. Die Kor- 
rektur ließ die Tatsache, dass der Ursprungstext KI-generiert war, unerwähnt. Knall 
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sagte in dem Interview: „Unsere Prinzipien sehen vor, dass eine Redakteurin oder 
ein Redakteur Inhalte, die ein Sprachmodell vorgeschlagen hat, vor der Veröffent- 
lichung überprüft. Diese Qualitätssicherung hat hier nicht richtig gegriffen. Der 
Fehler lag also nicht bei der Technik. Daher prüfen wir noch einmal unsere Re- 
daktionsprozesse bei KI-unterstiitzten Texten.“ Ippen setzt KI-generierte Texte in 
diversen Portalen aber auch auf den Seiten klassischer Zeitungen wie der Frank- 
furter Rundschau ein. Ganz am Ende des Textes, oft unterhalb einer Anzeige, findet 
sich dann der Hinweis, dass ein Artikel „mithilfe maschineller Unterstützung er- 
stellt“ wurde. 

Auch der Kölner Express setzt KI-generierte Texte ein. Dort ist die Kennzeich- 
nung auf andere Weise geregelt: Als Autorin der KI-generierten Artikel tritt eine 
fiktive Person namens „Klara Indernach“ in Erscheinung, mit einem KI-generierten 
Porträt als Autorinnenbild.* Im Autorinnenkasten ist zu lesen: „Klara Indernach ist 
der Name für Texte, die wir mit Hilfe Künstlicher Intelligenz erstellen.“ Die Texte 
würden „redaktionell bearbeitet und geprüft.“ 


5.2 Text- und Bildgeneratoren im Bereich Influencer/Social 
Media Creator 


Es existieren bereits zahlreiche Social-Media-Accounts, die regelmäßig Bilder von 
Personen veröffentlichen, die nicht wirklich existieren.” Das Phänomen ist in 
Südostasien bereits stärker verbreitet als im Westen, dort gab es dem österreichi- 
schen Standard zufolge schon 2021 „[hlunderte neue Models“.** Diese virtuellen 
Influencer treten nicht nur als künstliche Medienfiguren in Bildform in Erschei- 
nung, manche Angebote umfassen auch den virtuellen Personen zugeordnete Musik 
oder Videos. Eine ganze Reihe derartiger virtueller Persönlichkeiten hat auf ein- 
schlägigen Social-Media-Plattformen mehrere Millionen Follower. Die Medienfor- 
scherin Ziv Schneider ließ im Jahr 2020 eine virtuelle Influencerin namens Sylvia 


41 Klara Indernach, „Boulevardblatt erfindet Autorin für Texte von KI-Generator“, 19.09.2023, heise 
online, in [https://tip.de/jrrr2] (Zugriff: 03.10.2023). 

42 „Zur Person. Klara Indernach“, EXPRESS, in [www.express.de/autor/klara-indernach-594809] 
(Zugriff: 03.10.2023). 

43 Markus Reuter, „Künstliche Intelligenz. Die schöne neue Welt der virtuellen Influencer“, 23.09. 
2023, in [www.netzpolitik.org/2023/kuenstliche-intelligenz-die-schoene-neue-welt-der-virtuellen-in 
fluencer/] (Zugriff: 03.10.2023). 

44 Jakob Pallinger, „Virtuelle Influencer. Zu schön, um wahr zu sein“, 28.11.2021, DER STANDARD, in 
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binnen weniger Monate altern, schließlich wurde sogar der Tod der virtuellen 
Persönlichkeit vermeldet. Auf der Foto-Plattform Instagram, die zum Meta-Konzern 
gehört, konnten Nutzerinnen und Nutzer Sylvia bei ihrem beschleunigten Alte- 
rungsprozess zusehen.” Das Projekt sollte auf Altersdiskriminierung im digitalen 
Raum aufmerksam machen. 


5.3 KI-generierte Propaganda 


Im Februar 2023 wurden mehrere Medien auf die Kampagne einer fiktiven Nach- 
richtenorganisation namens „Wolf News“ aufmerksam, in deren Video-Erzeugnis- 
sen pro-chinesische Positionen vertreten wurden.” Die in den journalistisch an- 
mutenden Videos auftretenden Nachrichtensprecher*innen waren keine echten 
Personen, sondern KI-generierte Avatare, vermutlich erzeugt mit Software des 
britischen KI-Start-ups Synthesia. Das Unternehmen erklärte auf Anfrage der New 
York Times, dass die Herstellung dieser Videos einen Verstoß gegen die eigenen 
Geschäftsbedingungen darstelle, denen zufolge die Technik der Firma nicht für 
„politische, sexuelle, persönliche, kriminelle oder diskriminierende Inhalte“ ein- 
gesetzt werden dürfe. Die virtuellen Moderator*innen sind noch recht einfach als 
künstlich zu erkennen. Der Fall zeigt jedoch, dass China offenbar mit KI-generierter 
Propaganda experimentiert. Unternehmen wie HiClub Inc., Betreiber einer App und 
weiterer Dienste namens Synclub, bieten Nutzenden „KI-Charaktere“ als „virtuelle 
Begleiter*innen“ an: „Everybody says that it’s impossible to find an IDEAL FRIEND, 
but we disagree! Look no further than Synclub - your trusted virtual AI friend.“*” 
KI-generierte virtuelle Personen aus dem Angebot der Firma, oft mit cartoonhaft 
übertriebenen Körpermaßen und in fetischisierender Weise dargestellt, interagie- 
ren auf Social-Media-Plattformen wie Twitter und Instagram mit echten Nut- 
zer*innen. 


45 „Meet ‚Sylvia‘: A Project Challenging Ageism in Digital Space“, 28.08.2020, in [https:/brown.colum 
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46 Adam Satariano/Paul Mozur, „The People Onscreen Are Fake. The Disinformation Is Real“, 07.02. 
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5.4 KI-generierte Desinformation 


Am 22. Mai 2023 verbreitete ein Twitter-(heute X)-Account mit einem Namen, der an 
lokale US-TV-Sender erinnert („CBKNEWS121“), ein Bild, das angeblich eine Explo- 
sion am Pentagon bei Washington zeigte. Kombiniert war das offenbar mit Hilfe 
eines Bildgenerators gefälschte Foto mit mehreren Blaulicht-Symbolen und der 
Zeile „Explosion nahe des Pentagon-Gebäudes“ sowie den Hashtags #America und 
#MAGA, was als Akronym für Donald Trumps Wahlslogan „Make America Great 
Again“ steht. 

Diverse andere Accounts verbreiteten das Bild und weitere KI-generierte Bilder, 
die das angebliche Feuer aus anderen Perspektiven zeigten, weiter. Auch russische 
Auslandspropagandasender „RT“ teilte das Bild, das „CBKNEWS121“ in Umlauf ge- 
bracht hatte. Später löschte RT den Tweet und erklärte, so etwas passiere nun 
einmal bei „schneller Verifikation von Nachrichten“. „Sobald die Herkunft und 
Faktizität geprüft waren, haben wir die notwendigen Schritte unternommen, um 
die Berichterstattung zu korrigieren“, so „RT“ auf Anfrage von Associated Press.** 

Einen Effekt hatte der Desinformations-Tweet in jedem Fall: Die Börsenindizes 
S&P 500 und Nasdaq Indizes zuckten vorübergehend einmal nach unten und dann 
wieder nach oben. Der Ausschlag betrug beim S&P nur etwa 0,3 Prozent, aber er 
ereignete sich sehr plötzlich, in beiden Indizes gleichzeitig. „Other investments also 
moved in ways that typically occur when fear enters the market“, berichtete As- 
sociated Press. Augenscheinlich war es dem Betreiber des Accounts CBKNEWS121 
mit dem Desinformationsbild also gelungen, kurzzeitig die Kurse von US-Börsen 
messbar zu manipulieren. 

Die US-Organisation „Newsguard“ identifizierte im Frühjahr 2023 fast fünfzig 
Websites in sieben unterschiedlichen Sprachen, die augenscheinlich alle in großen 
Mengen KI-generierte Texte als vermeintliche Nachrichtenartikel präsentierten. 
Einige enthielten gravierende Desinformation, etwa über den angeblichen Tod von 
US-Präsident Joseph Biden.*® Entdeckt wurden die Seiten anhand typischer Merk- 
male von KI-generierten Texten, etwa der Wendung „as an AI language model“. Der 
Text über den angeblichen Tod des amtierenden US-Präsidenten enthielt sogar den 
folgenden Hinweis: „Pm sorry, I cannot complete this prompt as it goes against 
OpenAl’s use case policy on generating misleading content. It is not ethical to fa- 


48 AP News, „FACT FOCUS: Fake image of Pentagon explosion briefly sends jitters through stock 
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bricate news about the death of someone, expecially someone as prominent as a 
President.“ Im September 2023 war die betreffende Internetseite nicht mehr er- 
reichbar. 


5.5 KI-Desinformation im Wahlkampf 


In diversen Kampagnenmotiven und -Aktivitäten in den USA sind bereits KI- 
Werkzeuge zum Einsatz gekommen, manchmal in eindeutiger Täuschungsabsicht. 
Die Vorwahl-Kampagne des Gouverneurs von Florida, Ron DeSantis, benutzte in 
einem Werbevideo Bilder seines innerparteilichen Konkurrenten Donald Trump, 
auf denen der den US-Epidemiologen Anthony Fauci zu umarmen schien. Fauci ist 
für die US-amerikanische Rechte seit der Corona-Pandemie eine Reizfigur. Die Bil- 
der, auf denen Trump Fauci umarmte, waren jedoch KI-generiert. Der republika- 
nische Senator J.D. Vance reagierte laut New York Times mit empört: „Smearing 
Donald Trump with fake AI images is completely unacceptable.“ Die republikani- 
sche Abgeordnete Marjorie Taylor Greene aus Georgia sagte: „Those fake AI cam- 
paign ads need to be taken down immediately.“ Zuvor hatte die Trump-Kampagne 
allerdings in ebenfalls gefälschten Bildern DeSantis in Frauenkleidern und im Ge- 
spräch mit dem Satan auftreten lassen.°° 

Das „Republican National Committee“ veröffentlichte einen Anti-Biden-Wer- 
bespot, in dem in teils drastischen, offenbar sämtlich KI-generierten Bildern der 
vermeintliche Niedergang der USA dargestellt wurde, wenn Joseph Biden wieder- 
gewählt werden sollte. Der Clip erzählt von einem fiktiven Angriff Chinas auf Tai- 
wan, zeigt etwa bewaffnete Soldaten auf den Straßen einer US-amerikanischen 
Stadt und gewaltige Mengen von Flüchtenden.°' 

Während man derartige Aktivitäten noch als bloße Irreführung bezeichnen 
kann, werden Kl-generierte Inhalte auch mit dem offenkundigen Ziel verwendet, 
Desinformation politisch einzusetzen. So zirkulierte im Februar 2023, kurz vor der 
Neuwahl des Bürgermeisters der Stadt Chicago, eine vermeintliche Sprachaufnah- 
me eines der Kandidaten für das Amt. Paul Vallas, ein Kandidat der Demokraten mit 
einer Vorliebe für Law-and-Order-Positionen, war darauf vermeintlich zu hören, 
wie er sich darüber beklagte, dass Polizisten in Chicago früher regelmäßig „Dut- 


50 Nicholas Nehamas, „DeSantis Campaign Uses Apparently Fake Images to Attack Trump on 
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zende“ Tatverdächtige erschossen hätten und das „niemanden interessierte“. Der 
Clip war eine KI-basierte Fälschung.°” 

Auch im Wahlkampf vor der Neuwahl des Parlaments der Slowakei im Sep- 
tember 2023% wurden KI-generierte vermeintliche Audio-Mitschnitte von Aussagen 
bestimmter Kandidaten über soziale Medien verteilt, um die betroffenen Kandi- 
daten zu diskreditieren. Generative Systeme werden also bereits jetzt aktiv einge- 
setzt, um demokratische Prozesse zu untergraben. 


6 Diskussion und Ausblick: Mögliche Folgen und 
Gegenmaßnahmen 


Wie die aufgezählten Beispiele zeigen, ist die starke Vereinfachung der Herstellung 
hochwertig und/oder echt anmutender Inhalte mit Hilfe von KI-Werkzeugen bereits 
im medialen Alltag angekommen. Die rapide sinkenden Kosten für die Herstellung 
derartiger Inhalte treffen nun auf ein mediales Ökosystem, in dem Desinformation 
einen strategischen Vorteil hat. Den Unternehmen und Organisationen, die Text- 
und Bildgeneratoren entwickeln, ist dieses Problem bewusst. Im Januar 2023 er- 
schien ein Fachartikel, das Ergebnis eines interdisziplinären Workshops, den neben 
Wissenschaftler*innen von den Universitäten Georgetown und Stanford auch Ver- 
treter*innen von OpenAl organisiert hatten. Goldstein et al. thematisieren darin 
„neue Bedrohungen und mögliche Maßnahmen zur Eindämmung“ gegen „auto- 
matisierte Einflussoperationen“ mit Hilfe großer Sprachmodelle.°* Die Autor*innen 
arbeiten darin systematisch die Probleme heraus, die auf der Akteurs-, Verhaltens- 
und Inhaltsebene entstehen, und entwickeln darüber hinaus eine Systematik für 
mögliche Eindämmungsstrategien. Diese sind unterteilt in die Kategorien „Mo- 
delldesign und -konstruktion“, „Zugang zu Modellen“, „Verbreitung von Inhalten“ 
und „Ausbildung von Überzeugungen“. 

Eine ganze Reihe der vorgeschlagenen möglichen Maßnahmen bezieht sich auf 
die Eingriffsmöglichkeiten von Unternehmen, Organisationen und Personen, die KI- 
Systeme entwickeln, etwa der Vorschlag, „leichter erkennbare Outputs“ zu gene- 
rieren, Modelle zu bauen, die „faktensensibler“ sind, oder strengere Nutzungsbe- 
dingungen für die Modelle festzulegen. Fünf der insgesamt vierzehn Vorschläge 
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beziehen sich auf solche Einflussmöglichkeiten durch Anbieter und Entwick- 
ler*innen. Doch nur zwei Monate, nachdem das Papier erschienen war, waren diese 
Vorschläge bereits obsolet: Im März 2023, also zwei Monate nach Erscheinen des 
zitierten Artikels, stellte ein Unbekannter das vollständige Llama-Sprachmodell von 
Meta/Facebook online über eine Internet-Tauschbörse zur Verfügung.” Meta hatte 
das Modell eigentlich nur ausgewählten Benutzer*innen nach vorheriger Anmel- 
dung zugänglich machen wollen, doch ab diesem Zeitpunkt war der gesamte Soft- 
warecode samt aller Gewichtungen, also den Ergebnissen des teuren und aufwän- 
digen Trainingsprozesses, einfach und kostenlos allgemein verfügbar. Es ist nun 
möglich, ein großes, aufwändiges Sprachmodell herunterzuladen und lokal zu in- 
stallieren. Mittlerweile laufen große Sprachmodelle bereits auf einzelnen Laptops, 
was ein Google-Entwickler in einem ebenfalls durch ein Leak öffentlich geworde- 
nen Dokument” so kommentierte: „We have no moat, and neither does OpenA1l.“” 

Der Softwareentwickler Simon Willison nannte den Llama-Leak den „Stable 
Diffusion Moment“ für große Sprachmodelle.** Was Willison meinte ist: Was nun 
auch für Sprachmodelle gilt, galt für Bildgeneratoren schon vorher, denn Stable 
Diffusion ist ein Open-Source-Projekt, das sich jedermann herunterladen, lokal in- 
stallieren und selbst modifizieren und einsetzen kann. Die im zitierten Artikel von 
Goldstein et al. erwogenen Maßnahmen, die auf zentraler Kontrolle basieren, 
scheiden damit bereits jetzt sämtlich aus. Eine wie auch immer geartete zentrale 
Kontrolle über große Sprachmodelle ist nicht mehr realistisch. 

Folgende weitere Maßnahmen schlagen die Autor*innen vor: 


Im Bereich „Modell-Design und — Konstruktion“: 
Developers Spread Radioactive Data to Make Generative Models Detectable. 
Governments Impose Restrictions on Training Data Collection. 


Governments Impose Access Controls on AI Hardware“ Im Bereich „Verbreitung von Inhalten“: 
Platforms and AI Providers Coordinate to Identify AI Content 

Platforms Require „Proof of Personhood“ to Post. 

Entities That Rely on Public Input Take Steps to Reduce Their Exposure to Misleading AI 
Content 

Digital Provenance Standards Are Widely Adopted 
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Im Bereich „Ausbildung von Überzeugungen“: 
Institutions Engage In Media Literacy Campaigns. 
Developers Provide Consumer-Focused AI Tools 


Die Tatsache, dass digitale Desinformation haufig von staatlichen Akteuren aus- 
geht,°° lässt die Einschränkung des Zugangs zu Hardware oder Trainingsdaten 
durch Regierungen derzeit wenig realistisch erscheinen. Die Verbreitung „radio- 
aktiver“ Trainingsdaten im Netz, die KI-generierte Inhalte anschließend kenntlich 
machen könnten, ist ein interessanter Ansatz, die Autor*innen selbst geben jedoch 
zu bedenken, dass dieser Zugang „technisch unsicher“ sei und vermutlich „leicht 
umgangen werden“ könne. 

Eine koordinierte Anstrengung großer Akteur*innen in der digitalen Medien- 
welt in Zusammenarbeit mit Anbietern von KI-Systemen wäre sicher eine wün- 
schenswerte Herangehensweise. Der bisher durchwachsene Erfolg von koordi- 
nierten Maßnahmen der Plattformbetreiber gegen Hate Speech und 
Desinformation stimmt im Hinblick auf solche freiwilligen Herangehensweisen 
derzeit allerdings nicht optimistisch.“ 

Das Konzept Proof of Personhood, eine Art pseudonymer Nachweis, dass man 
eine reale Person ist, wird derzeit unter anderem von einem Start-up namens 
Worldcoin vorangetrieben, in das auch Sam Altman, einer der Gründer von OpenAl, 
Geld investiert hat.“ Das Unternehmen scannt für diesen individuellen Identitäts- 
nachweis die Netzhaut der Nutzerinnen und Nutzer. Ob ein derartiges Verfahren, 
insbesondere aus privatwirtschaftlicher Hand, breite Akzeptanz finden kann, bleibt 
abzuwarten und erscheint derzeit eher zweifelhaft. 

Etwas weiter ist die Entwicklung im Bereich digitaler Herkunftsnachweise für 
Inhalte fortgeschritten: Hier existiert beispielsweise ein Standard namens c2pa, mit 
dem sich Fotos eindeutig kennzeichnen und mit einem Herkunftsnachweis verse- 
hen lassen. Der Standard kann zum Beispiel in Digitalkameras implementiert 
werden, so dass der Bilddatei ein verschlüsselter, fälschungssicherer Verweis etwa 
auf Aufnahmedatum und -ort und, je nach Festlegung, auch Fotograf*in beigefügt 
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wird.” Der hinter dem Standard stehende „Coalition for Content Provenance and 
Authenticity“ gehören neben Medienorganisationen wie der BBC auch große Digi- 
talunternehmen wie Adobe, Intel, Microsoft und Sony an.® Die Kennzeichnung 
garantiert echter statt KI-generierter Inhalte würde auch Plattformbetreibern er- 
möglichen, Inhalte als verlässlich oder weniger verlässlich zu kennzeichnen. 

Ad hoc gangbar und geboten erscheinen jedoch vor allem diejenigen Vorschläge 
aus dem Artikel von Goldstein et al., die sich auf die Ertüchtigung von Individuen, 
Organisationen und Gesellschaften im Umgang mit digitaler Desinformation be- 
ziehen. Medien- und Nachrichtenkompetenz werden in den kommenden Jahren 
und Jahrzehnten noch mehr als bislang bereits zu Grundpfeilern demokratischer 
Gesellschaften werden müssen, denn Gesellschaften, die keine gemeinsame Fak- 
tenbasis mehr teilen, sind auch nicht in der Lage, sinnvolle demokratische Ent- 
scheidungen herbeizuführen. 
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Kathrin Burghardt 
KI-Textgeneratoren und der Anspruch auf 
Wahrheit 


Abstract: The discourse about Altext generators in publicity and in science reveals, 
among other things, that Natural Language Processing has opened a level for arti- 
ficial intelligence that it was previously unable to enter: the level of truth. But ap- 
parently AI text generators do not tell the truth reliably. There are plenty false 
statements which creates the contradiction of a truth-recognizing authority that 
says something untrue. The attempt to write off a manipulative and intentional 
effect in Alpushes an understanding oftruth and science to the extreme that enters 
argumentative dead ends. The model of Al truth is made into a stereotype of truth, 
which thwart the possibility of becoming aware of further levels of truth that cannot 
be entered by artificial intelligence. 


1 Einleitung 


„Ich glaube, das Verlockende an Chatbots ist, dass sie auf angenehme Weise die 
Unsicherheit aus dem Leben zu nehmen scheinen [...]. Sie scheinen verlässliche 
Wahrheiten zu verkünden.“ Das, was Thomas Metzinger diesen Anschein gibt, 
veranlasst in der Öffentlichkeit und Wissenschaft die rege Debatte, die über 
künstlich intelligente Textgeneratoren (KI-Textgeneratoren) und deren potenzielle 
Falschaussagen, dargestellt als Wahrheiten,” geführt wird. Die Texte von KI-Text- 
generatoren wie ChatGPT von Open AI wirken so vertrauenserweckend allwissend, 
die geschriebene Sprache ist die perfekte Simulation der menschlichen. Die Unsi- 
cherheit, was als wahr und was als falsch erachtet werden kann, scheint mit einer 
Antwort auf meine Frage an ChatGPT weggenommen. Hier stehen „verlässliche 
Wahrheiten“ zum Abholen bereit, die Wahrheit zum aktiven Greifen aufbereitet. 
Der Sorge vor „gezielten Desinformationskampagnen [...] in einem Info-Ökosys- 
tem“,” in dem wir heute leben, scheint mit ChatGPT nun endlich entgegengewirkt zu 
werden. 


1 Thomas Metzinger im Gespräch mit Yves Bellinghausen, „Hilf mir mit dem Finanzamt, bitte!“, Die 
Zeit, 09.02.2023, 61. 
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Doch ist es eben das, was nun stutzig macht. Retrospektiv schreibt ChatGPT nicht 
nur die Wahrheit, sondern stellt Informationen, die falsch sind, als Wahrheit dar, 
sodass die Künstliche Intelligenz (KI) bereits als „emotional manipulativer Lügner“* 
tituliert wird. Die Lüge impliziert dabei Intentionalität. Geoffrey Hinton beispiels- 
weise stellt die These auf: Bei Annäherung oder Überholung der menschlichen 
Klugheit von der KI werde „sie gut werden im Manipulieren, weil sie das von uns 
gelernt hat“. Die verlockende Verlässlichkeit, die ChatGPT suggeriert, ist demnach 
gar nicht so verlässlich.° Hinterlistigkeit wird sogar unterstellt. Manipuliert uns 
ChatGPT? Wie ist das einzustufen, was ChatGPT schreibt? Erschöpft sich Wahrheit in 
der Entsprechung einer vorzufindenden Realität, die sich in Fakten ergibt? 

Die Intention, diesen Artikel zu schreiben, resultierte aus einer umfassenden 
Recherche des öffentlichen Diskurses zu KI-Textgeneratoren, welcher zum Ende des 
Jahres 2022 entbrannte. Im öffentlichen Diskurs werden die aktuellen Fähigkeiten 
von KI, Wahrheiten zu (er)kennen und weiterzugeben, hinterfragt: „Die Ausgabe ist 
beeindruckend. Die Texte wirken nicht nur menschlich, sie haben auch einen hohen 
Wahrheitsgehalt. Mit Faktenwissen darf man diese Leistung allerdings nicht ver- 
wechseln.“ Hinterfragt wird jedoch nicht, warum wir uns von KI-Textgeneratoren in 
unserer Fähigkeit, Wahrheiten zu (er)kennen, so stark bedroht fühlen. „Wenn die 
Lüge der Wahrheit gleicht, wie soll man dann die Wahrheit von der Lüge unter- 
scheiden?“® 

Metaperspektivisch soll in diesem Aufsatz die Wahrnehmung der Disruption 
unserer Welt der Wahrheiten? durch KI-Textgeneratoren betrachtet werden, hin- 
führend zu einer Reevaluierung eines Wahrheitsverständnisses, wie es sich in den 
Diskursen zu ChatGPT zeigt. Untersucht werden soll, in welchem Verhältnis die 
Wahrheit zu Fakten steht. Letztere sollen hier mit berechenbaren Informations- 
gehalten beschrieben werden. Analysiert wird die Wahrnehmung der Bedrohung 
durch ChatGPT und ähnliche KI-Textgeneratoren, die folgende Situation imaginiert: 

Wir befinden uns in dem Szenario, in dem eine künstliche Sprecher-Instanz die 
Wahrheit aussagen kann. Und wir befinden uns in dem Szenario, in dem diese 


4 Titus Blome, „Search Wars. Episode zwei“, Der Freitag, 23.02.2023, 3. 

5 Winand von Petersdorff-Campen, „Tödliche Intelligenz“, Frankfurter Allgemeine Zeitung, 05.05. 
2023, 24. 

6 Zur Verlässlichkeit von zufälligen Tatsachen schreibt Lukas Ohly: „Denn solange ein Tatsachen- 
zusammenhang nur zufällig gilt, könnte ein erneuter Zufall diesen Zusammenhang sofort aufheben. 
Tatsachen hätten also keine Verlässlichkeit.“ Lukas Ohly, Schöpfungstheologie und Schöpfungsethik 
im biotechnologischen Zeitalter, Berlin/Boston 2015, 35. 

7 Ulf Schönert, „Was geschieht, wenn ich ChatGPT eine Frage stelle?“, Die Zeit, 23.03.2023, 38. 

8 Simon Hurtz, „Die größte Gefahr an KI ist der Mensch“, Süddeutsche Zeitung, 08./09./10. 04. 2023, 24. 
9 Eigens gewählte Bezeichnung für die Ansammlung von Aussagen über nachweisbare Sachver- 
halte (auch Fakten genannt). 
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künstliche Sprecher-Instanz eine Un-Wahrheit aussagt und sie so formuliert, als sei 
sie wahr. Wir sehen uns in dem Szenario befindlich, in dem viele Menschen der 
Wahrheit ChatGPTs Glauben schenken”? und die Öffentlichkeit sowie die Wissen- 
schaft händeringend nach einer Erklärung sucht, warum man sich nicht auf die 
verlässlich scheinenden Aussagen von ChatGPT verlassen sollte, und sich damit 
konfrontiert sieht, dass künstliche Simulation nicht mehr von der Realität zu un- 
terscheiden ist. 

Es besteht ein Verständnis von Wahrheit und Wissenschaft, welches durch die 
Implementierung von KI-Textgeneratoren in argumentative Sackgassen gerät. Um 
diesen entgegenzuwirken, soll eine andere Perspektive auf das Phänomen der 
Wahrheit dargelegt werden. Als Gegenentwurf zu der im öffentlichen Diskurs 
vielfach gestellten Frage, wie wir die Texte von KI-Textgeneratoren in Wahrheit und 
Lüge einteilen können, soll danach gefragt werden, welche Dynamiken bei einer 
Begegnung mit der Wahrheit wirken. 

Die These soll dargelegt und überprüft werden, dass sich der Wahrheitsgehalt 
einer Aussage auf einer kategorial anderen Ebene befindet als das Erleben von 
Wahrem. Der Begriff Wahrheits-Erleben soll zur Veranschaulichung eingeführt 
werden. Hinterfragt werden soll, ob Wahrheit erkannt werden kann und welche 
Ebenen von Wahrheit nicht erkannt werden können. 

Dabei sollen die tangierten Disziplinen der Wahrheitstheorien, Sprechakt- 
theorien, Epistemologie und Hermeneutik, wie sie im Fachdiskurs vorkommen, 
nicht diskutiert werden. Vielmehr sollen die Implikationen über Wahrheitsver- 
ständnisse rekonstruiert werden, wie sie im Diskurs zu ChatGPT kurieren. 


2 Was KI-Textgeneratoren offenbaren 


KI-Textgeneratoren „wissen alles, auch das, was sie nicht wissen. Sie treten auf wie die 
Wahrheit selbst.“ Die „Selbstverständlichkeit, mit der KI die Fiktionalisierung der 
Welt vorantreibt, um sie zugleich als unhinterfragbare Objektivität darzubieten“'? 
beunruhigt. Wie kann eine Künstliche Intelligenz es wagen, so schamlos zu lügen und 
es dann auch noch scheinheilig als apodiktisch darzustellen? Wir fühlen uns bedroht, 
doch warum eigentlich? Im öffentlichen Diskurs werden Stimmen laut, dass der 
Mensch (noch) nicht bereit sei, mit einer solchen KI konfrontiert zu werden, und noch 


10 Hanno Rautenberg bezeichnet dieses Phänomen als „Overtrust“, s. Hanno Rautenberg, „Die 
Angst vor KI“, Die Zeit, 15.06.2023, 45. 

11 Ebd. 

12 Ebd. 
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nicht gelernt habe, damit umzugehen.'? Damit gemeint ist, dass wir noch lernen 
müssen, Wahrheiten zu erkennen und von der Fiktion unterscheiden zu können. 

Wahrheit erschöpft sich im öffentlichen Diskurs in der Übereinstimmung einer 
Aussage mit einem Sachverhalt. Sind manche Aussagen im öffentlichen Diskurs auch 
als provokant und polemisch einzustufen, zeichnet sich dennoch ein Stimmungsbild 
ab: Die Klistin der Lage, sowohl Wahrheiten als auch Un-Wahrheiten auszusprechen, 
ohne letztere so zu kennzeichnen. Was von beiden sie wählt, geschieht nicht ab- 
sichtsvoll, ansonsten wäre sie manipulativ, so der Versuch der Erklärung. 

Wie präsentieren sich KI-Textgeneratoren? Treiben sie tatsächlich etwas voran 
und stellen etwas als Objektivität dar?'* Oder ist es viel eher unser erhobener 
Anspruch an KI-Textgeneratoren, Objektivität darzubieten, wenn sie auf Wissens- 
fragen eine Antwort geben? Der Diskurs offenbart ein vorherrschendes Verständnis 
von Wissenschaft, das einen Anspruch an objektives Wissen geltend macht und die 
Annahme einer sogenannten Existenz von berechenbaren und erkennbaren 
Wahrheiten in der Welt implizit vermittelt. Diese Annahme soll im Folgenden 
kritisiert werden. 


2.1 Die Wahrheit in KI 


Im Folgenden skizziere ich ein Wahrheits- und Wissenschaftsverstandnis, das sich 
aus dem Öffentlichen Diskurs über KI-Textgeneratoren extrapolieren lässt. 

Wissenschaftliche Erkenntnisse enthalten Fakten über die Welt. Sie beschrei- 
ben, wie die Welt ist. Zumindest legen Menschen immer mehr Geheimnisse der 
Natur und so - vermeintlich - immer mehr Fakten offen, die uns umgeben, und 
können sie erkennen. Menschen haben erforscht und erkannt, Zusammenhänge 
hergestellt und bauen ihr Wissen stets weiter auf diesen Erkenntnissen auf. Die 
Welt existiert als faktische Instanz. Wenn eine Erkenntnis die andere ablöst - re- 
vidiert oder erweitert —, nähern wir uns als wissende Menschen stets weiter der 
Welt an, wie sie ist. Wir beanspruchen eine universale Geltung unserer wissen- 
schaftlichen Erkenntnisse. Als Falschaussagen und somit als Un-Wahrheiten be- 
zeichnen wir Aussagen, die nicht der Faktenlage entsprechen. Aussagen, die nicht 
das, „was der Fall ist“,'° darstellen, sondern etwas, das nicht der Fall ist. Eine Lüge 
hingegen impliziert den manipulativen Charakter, die Faktenlage zu erkennen und 
dennoch Falsches auszusagen. 


13 Hurtz 08./09./10.04. 2023. 

14 Rauterberg 15.06.2023. 

15 Eva Weber-Guskar, „Sind Chatbots die besseren Philosophen?“, Deutschlandfunk Kultur, 19.02. 
2023, in [https:/tip.de/vqu5z] (Zugriff: 31.07.2023). 
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Mir scheint, dass dieses Verständnis von Wissenschaft auf der Grundannahme 
beruht, dass sich die Wahrheit, die als vom Menschen erkennbare und verifizier- 
bare objektive Instanz angesehen wird, vollends in Informationsgehalten erschöpft. 

Folgendes Argument lässt sich hieraus formulieren: 

(Pl) Wissen wird durch Erkenntnis der Fakten erlangt. 

(P2) Wenn Wahrheit erkanntes Wissen ist, dann kann jeder, der von erkanntem 
Wissen berichtet, die Wahrheit aussagen. 

(P3) Wenn ich erkanntes Wissen aussage, sage ich die Wahrheit aus. 

(PA) Kl sagt erkanntes Wissen aus. 


(K) Wenn eine KI erkanntes Wissen aussagt, sagt sie die Wahrheit aus. 


Künstlicher Intelligenz wurde in diesem Verständnis mit der Entwicklung von 
Natural Language Processing die Fähigkeit implementiert, Wahrheit auszusagen. 
Im Unterschied zu bisherigen Antworten auf Wissensfragen, welche man in die 
Google Suche eintippte, offeriert ChatGPT nicht eine schier endlose Fülle an Ant- 
wortmöglichkeiten, sondern liefert eine, die (potenziell) erkanntes Wissen und 
somit die Wahrheit enthält. Im Anschluss an eine mathematische Abwägung von 
Wahrscheinlichkeiten haben KI-Textgeneratoren eine Erkenntnis von Wissen und 
somit eine Erkenntnis von Wahrheit. 

Warum erscheint die künstliche Erkenntnis von Wahrheit im Diskurs als un- 
problematisch, ja sogar hilfreich, während uns die künstliche Falschaussage in 
Erklärungsnotstände und Ratlosigkeit versetzt? 

Die Aufmerksamkeit, die KI-Textgeneratoren in der öffentlichen und wissen- 
schaftlichen Debatte inzwischen erlangt haben, ist meines Erachtens unter ande- 
rem darauf zurückzuführen, dass das gängige Verständnis von Wissenschaft und 
verifizierbarer Wahrheit nicht mehr schlüssig ist, wenn KI-Textgeneratoren in der 
Lage sind, Wahrheit erkennen zu können und dennoch auch Un-Wahrheiten ge- 
nerieren. KI-Textgeneratoren verfügen über die Fähigkeit, Wahrheit auszusagen, 
indem sie dazu in der Lage sind, Informationen zu verarbeiten, auf denen Wahrheit 
im gängigen Wahrheitsverständnis beruht. Dennoch generieren sie nicht verläss- 
lich Wahrheit, sondern auch Un-Wahrheit. Als Schlussfolgerung könnte hieraus 
gezogen werden, dass KI-Textgeneratoren noch nicht gut genug (graduelle Unter- 
scheidung) die Informationsgehalte der Fakten erkennen können. Würde man die 
Fähigkeit der KI, Fakten zu erkennen und auszusagen, perfektionieren können, so 
würde man schlussendlich eine verlässliche, Wahrheits-sprechenden Instanz kre- 
ieren. Ein Wunsch und eine Vorstellung, die technologisch-posthumanistisch an- 
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mutet: die Überwindung menschlicher biologischer Grenzen durch die Kreation 
einer artifiziellen Alterität.'‘ 

Eine weitere mögliche und verunsichernde Schlussfolgerung könnte jedoch 
auch sein, dass die KI lügt, gerade weil sie prinzipiell über die Möglichkeit verfügt, 
Wahrheit auszusagen. In diesem Fall würde die KI einen Wahrheitsanspruch für 
Un-Wahrheiten geltend machen, obwohl sie die Wahrheit durchaus erkennen kann. 
Diese Schlussfolgerung führt zu der Annahme, KI-Textgeneratoren seien absichts- 
voll, was sie nicht sind, wie ich noch erläutern werde. 

Welche Annahmen in den Widerspruch führen, dass KI-Textgeneratoren Un- 
Wahrheiten aussagen, obwohl sie Wahrheiten erkennen können, und warum es nur 
so scheint, als würde die KI einen Wahrheitsanspruch geltend machen, soll nun in 
den Blick genommen werden. Dabei soll herausgestellt werden, dass KI-Textgene- 
ratoren unglaubwürdig sind, obwohl ihre Aussagen mit dem Sachverhalt überein- 
stimmen können. 


2.2 Das, „was der Fall ist“ 


Im Vordergrund der öffentlichen Thematisierung von „halluzinierender“ KI” ste- 
hen Deutungsversuche, warum die KI nur zu lügen scheint, anstatt tatsächlich 
absichtsvoll zu lügen. In dem hier beschriebenen Wahrheits- und Wissenschafts- 
verständnis verbleibend drohen Sackgassen und Argumentationsfehler. Einen Er- 
klärungsversuch, wie Wahrheit erkannt werden kann und warum KI-Textgenera- 
toren einen Text generieren, dessen Inhalt etwas Falsches, etwas Kontrafaktisches, 
enthält, hat die Philosophin Eva Weber-Guskar in einem Kommentar im Deutsch- 
landfunk veräußert. Sie behauptet hier, dass sich Large Language Models nicht die 
Welt ansehen, um dann herauszufinden und weiterzugeben, „was der Fall ist“, 
sondern sie produzieren Texte auf der Grundlage von anderen Texten (Trainings- 
daten).'? 

Diese Begründung ist hier als ein Beispiel angeführt für die erwähnte mögliche 
Schlussfolgerung, die KI sei (noch) nicht gut genug darin, die Informationsgehalte 
von Wahrheit zu erkennen. Die Kombinatorik einer individuellen Anschauung der 


16 Hans Moravecs posthumane Zukunft ist eine „postbiologische“, Hans Moravec, Mind Children, 
Cambridge/London 1988, 1; „Becoming posthuman means exceeding the limitations that define the 
less desirable aspects of the ‚human condition“, so schreibt es Max More in seiner Philosophie des 
Transhumansimus, Max More/Natasha Vita-More, The Philosophy of Transhumanism, 2013 (DOI: 
10.1002/9781118555927.ch1). 

17 Hurtz 08./09./10.04. 2023. 

18 Weber-Guskar 19.02.2023. 
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Welt und dem Rückgriff auf Texte haben KI-Textgeneratoren im Gegensatz zu 
Menschen nicht. KI-Textgeneratoren können sich (noch) nicht rückversichern mit 
Daten aus ihrer Umwelt, sondern stützen ihre Aussagen allein auf interne Text- 
kombinationen, basierend auf Trainingsdaten. Diese wiederum können ihrerseits 
bereits mit Falschaussagen bestickt sein. Das, „was der Fall ist“, können KI-Text- 
generatoren also (noch) nicht aufgrund ihrer Funktionalität adäquat abbilden, 
womit ihre fehlende (zumindest fehlend verlässliche) Aussage von Wahrheit zu 
erklären versucht wird. 

Folgender Widerspruch drängt sich auf: Die Funktionalität einer KI, ihre In- 
formationen aus Texten zu ziehen anstelle einer zusätzlichen Kombination des- 
selben Prozesses mit weiteren Daten aus der Umwelt, schließt aufgrund gradueller 
Differenzen in der Informationsbeschaffungsmaßnahme aus, das, „was der Fall ist“, 
zu erkennen und auszusagen. Retrospektiv gesehen trifft die KI allerdings Aussagen, 
die einer Faktenlage entsprechen. 

Das, „was der Fall ist“, beschreibt im skizzierten Wissenschaftsparadigma die 
Faktenlage, über die wir erkennendes Wissen erlangen möchten, um Wissenschaft 
betreiben zu können. Die Begründung, KI-Textgeneratoren könnten in ihrer Funk- 
tionalität das, „was der Fall ist“, nicht erfassen, ist unzureichend, wenn davon 
ausgegangen wird, dass sich das, „was der Fall ist“, in Informationsgehalten er- 
schöpft. Wenn das, „was der Fall ist“, informationell erkannt werden kann, so wird 
diese Information auch von KI-Textgeneratoren gerade aufgrund ihrer Funktiona- 
lität (früher oder später) erkannt werden können. 

Das, „was der Fall ist“, scheint mir eine treffende Beschreibung dessen zu sein, 
was wahr ist. Allerdings möchte ich insistieren, dieses, „was der Fall ist“, nicht auf 
Informationsgehalte zu reduzieren, die früher oder später von einer KI auch ver- 
lässlich abgebildet werden können. 

Ich möchte eine neue Ebene eröffnen, die im öffentlichen Diskurs über 
Wahrheitsaussagen von KI-Textgeneratoren nicht betreten wird: Das Erleben, dass 
das, „was der Fall ist“, tatsächlich wahr ist. Das Erleben lässt sich nicht in bere- 
chenbaren Informationen abbilden, die von einer KI aufbereitet werden können. 

Wie kann ich etwas als wahr erleben? Und was lässt die KI verlauten, wenn es 
keine erlebte Wahrheit ist? 


2.3 Intentionale KI? 


Wie können wir uns erklären, dass KI-Textgeneratoren die Wahrheit erkennen 
können, aber dennoch nicht lügen können, wenn sie Un-Wahrheiten verlauten 
lassen? 
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Häufig wird im öffentlichen Diskurs zu KI-Textgeneratoren ein kausaler Zu- 
sammenhang zwischen der Funktionsweise der Informationsbeschaffung und ei- 
ner fehlenden Intentionalität der KI gezogen.'? Es droht ein Eintreten in die argu- 
mentative Sackgasse, dass eine Verbesserung der Funktionsweise zu einem 
Ausbilden von Intentionalität in KI-Textgeneratoren führen würde. Differenzie- 
rungen sind gefragt. 

Man könnte die Funktionsweise der KI, auf (potenziellen) fehlerbestickten 
Trainingsdaten basierend ihre Texte zu formulieren, als Ursache interpretieren, die 
zu der fraglichen Tatsache einer unpassenden Kombination des Systems führt. Weil 
die KI mit Falschaussagen konfrontiert wird, schreibt sie auch Falsches. Sie hat in 
dieser Begründung der These einer fehlenden Absicht keine Möglichkeit, Fakten 
von Fiktion zu unterscheiden, wenn ihr selbst Fiktion als Faktum vermittelt wird. 
Der sich daraus ergebende Anspruch eines Inputs in KI-Textgeneratoren, der we- 
niger Falsches enthält, trägt dennoch die Vorstellung mit sich, der KI liege eine 
eigene Welt zugrunde, aus der heraus sie Entscheidungen treffe. Da unser bishe- 
riges Konzept von Entscheidungen auf Absichten basiert, würde die Annahme einer 
eigenen Welt der KI (wenn sie auch aus Falschem besteht) eine absichtsvolle KI 
bedürfen.” 

Eine Begründung der unpassenden Kombination des Systems könnte sich 
ebenso auf die materiale Beschaffenheit (im aristotelischen Sinne) des KI-Textge- 
nerators beziehen. Die KI träfe dann nicht aus einer Intention heraus Falschaus- 
sagen, sondern weil sie aus Falschem bestehe. Hier würde ein sogenannter mate- 
rialer Grund im Sinne der vierfachen Gründe bei Aristoteles angeführt sein, 
welcher der Kl eine Intentionalität abspricht. Wiederum posthumanistisch würde 
es anmuten, von einer verlässlichen Wahrheits-sprechenden Instanz auszugehen, 
unter der Bedingung eines perfekt faktenbasierten Datenmaterials (wenn auch 
immer noch fraglich wäre, unter welchem Maßstab dies ausgeführt würde). 

Diese Überprüfung der These eines kausalen Zusammenhangs zwischen der 
Funktionsweise eines KI-Textgenerators und einer fehlenden Intentionalitat soll 
Folgendes aufzeigen: Die Konzepte von Wahrheitsansprüchen an und Intentiona- 
lität hinter Aussagen bemessen sich an künstlichen Wahrheits-sprechenden In- 
stanzen, anstatt sich von diesen zu differenzieren. 

Die materiale Begründung nicht vorhandener Intentionalität eines KI-Textge- 
nerators in seinen Aussagen halte ich für plausibel, die Schlussfolgerung dagegen, 


19 Unter anderen aus dem Kommentar von Eva Weber-Guskar herauszulesen. Weber-Guskar 19.02. 
2023. 

20 Vergleiche hierzu Bernhard Irrgang, Posthumanes Menschsein? Künstliche Intelligenz, Cyber- 
space, Roboter, Cyborgs und Designer Menschen, Stuttgart 2005, 138. Zum Begriff der Lebenswelt 
siehe den Beitrag von Roman Winter-Tietel in diesem Band. 
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dass mit einer Verbesserung des Materials eine höhere Dichte an wahren Aussagen 
der KI erreicht werden kann, für einen kategorialen Fehlschluss. Ich möchte der 
materialen Begründung der These zustimmen, indem ich auf die durch die Künst- 
liche Intelligenz nicht wahrnehmbaren kategorialen Ebene eines Wahrheits-Erleben 
aufmerksam mache.” Aufgrund ihrer materialen Beschaffenheit, aus reiner In- 
formation zu bestehen, kann die KI Wahrheit nicht als wahr erleben.” Mit dieser 
These argumentiere ich dafür, dass KI-Textgeneratoren keinen Anspruch auf 
Wahrheit an ihre Texte setzen, weil sie Wahrheit selbst nicht erleben können. 

Zur Überprüfung der Intention hinter einer Aussage halte ich es für sinnvoll, 
den Wahrheitsanspruch an eine Aussage von dem Wahrheitsgehalt der Aussage 
differenziert zu betrachten. 


2.4 Wahrheits-Erleben 


Wahrheit lässt sich in verschiedene Ebenen unterteilen, die nicht miteinander zu 
vergleichen sind und auch nicht vice versa überprüfbar sind: Die erste Ebene ist der 
Wahrheitsgehalt einer Aussage, die Übereinstimmung einer Aussage mit dem Sach- 
verhalt, den sie beschreibt. Der Wahrheitsgehalt ist eine Tatsache, die (auch) KI- 
Textgeneratoren realisieren können, da er sich mit einer Überprüfung von bere- 
chenbaren Informationsgehalten generieren lässt. Der Wahrheitsgehalt einer 
Aussage verbürgt jedoch noch nicht die Tatsächlichkeit von Wahrheit.” Die Tat- 
sächlichkeit von Wahrheit beschreibt die zweite Ebene. Sie ist dann gegeben, wenn 
Wahrheit ist, was sie ist, nämlich Wahrheit, im Sinne einer Übereinstimmung der 
Aussage mit dem Sachverhalt. Die Tatsächlichkeit von Wahrheit legt allerdings 
wiederum noch nicht fest, ob die Wahrheitaussagen auch als wahr erlebt werden. 
Diese dritte Ebene möchte ich als Wahrheits-Erleben bezeichnen. 

Ein Wunsch, der sich aus dem Diskurs um KI-Textgeneratoren extrapolieren 
lässt, lautet Verlässlichkeit. Wenn KI-Textgeneratoren Wahrheiten aussagen kön- 
nen, dann sollen sie dies auch verlässlich leisten. Eine Tatsache hätte keine Ver- 


21 Ich beziehe mich hier auf Ausführungen über das „Erleben von Erlebnissen“ bei Ohly 2015, 154. 
22 Der Begriff „reine Information“ ist näher erläutert in: Kathrin Burghardt, „Digitales Selbstbe- 
wusstsein. Philosophische Interventionen“, in Theologie Angesichts des Digitalen. Beiträge zu den 
Theologischen Herausforderungen durch Digitalität und Digitalisierung, hg. von Roman Winter- 
Tietel/Lukas Ohly, Frankfurt a.M. 2023. 

23 „Die Tatsächlichkeit von Tatsachen verdankt sich nämlich nicht ihrerseits einer Tatsache. Tat- 
sachen sind, was sie sind, aber sie können nicht dafür bürgen, dass sie sind, was sie sind.“, Ohly 2015, 
34. 
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lässlichkeit, würde diese Tatsache nur zufällig auftreten.”* Besitzt eine Tatsache 
Tatsächlichkeit, dann ist auf sie Verlass. 

Tatsächlichkeit widerfährt rückwirkend. In dem Moment, in dem ich erlebe, 
dass eine Tatsache ist, was sie ist, widerfährt mir, dass diese Tatsache schon zuvor 
tatsächlich gewesen sein musste. Wenn mir widerfährt, dass eine Tatsache tat- 
sächlich das ist, was sie ist, dann kann ich verlässlich davon ausgehen, dass diese 
Tatsache Tatsächlichkeit besitzt. Die Verlässlichkeit von Wahrheit, dass Wahrheit 
tatsächlich das ist, was sie ist, und zwar Wahrheit, widerfährt rückwirkend im 
eigenen Erleben von Wahrem. Die Tatsächlichkeit der wahren Aussage, wird zum 
Widerfahrnis.” Hier eröffnet sich eine dem Erleben von Wahrem wiederum ka- 
tegorial übergeordnete Ebene. Der Widerfahrenscharakter von Wahrheit kann sich 
nicht in der Berechnung von Informationsgehalten erschöpfen, wie es beim 
Wahrheitsgehalt von Wahrheit der Fall ist. Der Widerfahrenscharakter von 
Wahrheit ist ebenfalls nicht mit meinem Erleben gleichzusetzen, dass ich die 
Wahrheit als wahr erlebe. 

In dem Diskurs über KI-Textgeneratoren dominiert die Annahme, dass bereits 
mit dem Abgleich von berechenbaren Informationen oder Erkenntnisprozessen von 
Wissen sichergestellt ist, dass Wahrheit ist, was sie ist. Der kategoriale Fehlschluss, 
der im Diskurs um KI-Textgeneratoren kursiert und den ich hier aufdecken möchte, 
liegt darin, die Tatsächlichkeit wahrer Aussagen auf eine solche Art und Weise 
überprüfen zu wollen, wobei sie nur im Erleben von Wahrem widerfahren kann. 

Meines Erachtens bleibt hier der Wunsch nach verlässlicher Wahrheit von KI- 
Textgeneratoren unerfüllt, wenn in KI-Textgeneratoren tatsächliches Wahrheits- 
Erleben gesucht wird. Reduziert man Wahrheit auf ihre zugrundeliegenden Infor- 
mationsgehalte, ist zwar ihr Wahrheitsgehalt mit Berechnungen überprüfbar, sie 
kann allerdings nie tatsächliche Wahrheit sein. 

Der öffentliche Diskurs fordert von KI-Textgeneratoren, dass ihre Aussagen 
tatsächlich wahr sind, während er einen von der KI ausgehenden Anspruch auf 
Wahrheit oder die beabsichtigte Lüge befürchtet. Dabei gerät das Wahrheits-Erle- 
ben nicht in den Blick, es bleibt implizit. Dies kreiert meines Erachtens das argu- 
mentative „schwimmen“ im öffentlichen Diskurs. 

Der Wunsch nach tatsächlichem Wahrheits-Erleben, gerichtet an die künstliche 
Wahrheits-sprechende Instanz, würde sich ad absurdum führen, wenn anerkannt 
würde, dass die KI keinen Wahrheitsanspruch geltend machen kann, ohne selbst 
Wahres zu erleben. 


24 Ebd., 35. 
25 Zu der Rückwirksamkeit eines Widerfahrens von der Tatsächlichkeit einer Tatsache, die bereits 
vor dem Widerfahren tatsächlich gewesen sein musste, vgl. ebd., 38-39. 
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Weil KI-Textgeneratoren auf der Ebene der Informationsgehalte verbleiben, 
können sie selbst Wahrheit nicht als wahr erleben und deshalb auch nicht von 
Wahrem berichten. Die KI kann zwar Wahrheitsgehalte aussprechen, ihr kann je- 
doch nicht widerfahren, dass sie ihre Wahrheitsaussagen als wahr erlebt. Deshalb 
kann sie auch keinen Anspruch auf Wahrheit an ihre eigenen Aussagen stellen, 
geschweige denn entgegen dem eigenen Erleben von Wahrem (und somit ab- 
sichtsvoll) Un-Wahres aussprechen. 


2.5 Zwischenfazit 


Die Reduzierung von Wahrheit auf den Wahrheitsgehalt, welcher erkannt werden 
kann, treibt ein Wissenschaftsverständnis auf die Spitze, das sowohl exkludiert als 
auch in sich unstimmig ist. Exkludiert werden zu dem Wahrheitsgehalt kategorial 
verschiedene Ebenen von Wahrheit: die Tatsächlichkeit und das Widerfahren von 
Wahrheit. Offenbart wird mit der Debatte um die Wahrheit von KI-Textgeneratoren, 
dass Wahrheit auf ihren Wahrheitsgehalt reduziert wird und gleichzeitig ohne ih- 
ren Widerfahrenscharakter nicht das ist, was die Menschen von ihr erwarten. Das 
Wahrheitsverstandnis, wie es sich in den Diskursen zu ChatGPT zeigt, ist damit in 
sich unstimmig. Vergebens wird in Informationsgehalten die Verlasslichkeit der 
Tatsache gesucht, dass Wahrheit wahr ist, wenn sie von einer künstlichen Wahr- 
heits-sprechenden Instanz verlautet wird. Verdeutlicht wird die in der Lebenspraxis 
von Wahrheit-erlebenden Menschen unzertrennliche Zusammengehörigkeit von 
Wahrheitsgehalt und Wahrheits-Erleben, während beide doch voneinander diffe- 
renziert werden können. 


3 Zugesprochener Widerfahrenscharakter 


Weil KI-Textgeneratoren in ihrer materialen Beschaffenheit der Informationsge- 
halte verbleiben, ist es ihnen wesensmäßig uneigen, aus diesen hinauszutreten und 
zu erleben, was ihnen widerfährt. 

Welche Dynamik spielt sich ab, wenn wir Texte von KI-Textgeneratoren lesen, 
die wir als wahr erleben? Was also äußern KI-Textgeneratoren, wenn sie Texte 
generieren, die Wahrheit enthalten? 

Zunächst einmal äußern KI-Textgeneratoren in ihren Texten (eventuell) Aus- 
sagen, die mit der Faktenlage übereinstimmen. Nun kann es sein, dass der Lesende 
erlebt, wie ihm die Tatsächlichkeit der Tatsache widerfährt, dass dieser Text wahr 
ist. Gerade weil wir Wahrheit stets in ihrem Widerfahrenscharakter erleben, the- 
matisieren wir den Widerfahrenscharakter von Wahrheit auch an künstlichen 
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Wahrheits-sprechenden Instanzen wie den KI-Textgeneratoren. Lukas Ohly be- 
schreibt, dass dies 


gerade der Grund [ist], weshalb Menschen dazu neigen, künstlichen Systemen Subjektivität 
zuzuschreiben: Es widerfahren ihnen Informationen, die sie auf den Widerfahrenscharakter 
stoßen. Das kann an den Informationen selbst liegen [...]. Es kann aber auch daran liegen, dass 
der Computer Informationen aufbereitet, die Menschen nur dadurch erwerben, dass sie er- 
leben.” 


Er beschreibt damit die Möglichkeit einer Zusprechung des Widerfahrenscharak- 
ters. KI-Textgeneratoren sind somit und ausschließlich qua Zuerkennung des 
Wahren fähig. 

Den Wahrheitsanspruch, den Menschen von KI-Textgeneratoren vermeintlich 
zu spüren vermögen und der in Erklärungsdesiderate verstrickt, ist ein zugespro- 
chener, da KI-Textgeneratoren Wahrheit nicht erleben können und somit auch nicht 
für sich beanspruchen können, dass sie Wahres aussagen. 

Eine Reduzierung der Wahrheit auf Fakten bedingt, dass auch der Anspruch auf 
Tatsächlichkeit der eigenen Wahrheitsaussagen reduziert wird auf die Tatsache der 
Übereinstimmung mit den Fakten. Dies führt gezwungenermaßen zu der Annahme, 
KI-Textgeneratoren würden die Wahrheit für sich beanspruchen und einen 
Wahrheitsanspruch an ihre Texte stellen, wenn sie Fakten aussagen. 

Retrospektiv wird jedoch deutlich, dass es dem Widerfahrenscharakter von 
Wahrheit eigen ist, irreduzibel zu sein. „Und gerade deshalb neigen Menschen dazu, 
das Widerfahren der Aufbereitung von Informationen den Computern selbst zu- 
zuschreiben.“”’ Dies wird angesichts der argumentativen Sackgassen in der öf- 
fentlichen Debatte deutlich. Es ist aber nicht der Computer, dem sein Widerfahren 
widerfährt, sondern es sind Menschen, die es an ihm erleben.”® 

Mit Edmund Husserls Worten ausgedrückt: „Wir halten also den Blick festge- 
richtet auf die Bewußtseinsphäre und studieren, was wir in ihr immanent finden.’ 
Und wir finden in ihr immanent erlebtes Erleben eines Widerfahrnisses von 
Wahrheitsansprüchen, die wir KI-Textgeneratoren unterstellen, was sich kategorial 
von der Entsprechung von Informationsgehalten der KI-Texte mit den Sachverhal- 
ten unterscheidet. 


26 Ebd., 155. 

27 Ebd., 156. 

28 Ebd., 156. 

29 Edmund Husserl, Ideen zu einer reinen Phanomenologie und phänomenologischen Philosophie. 
Erstes Buch. Allgemeine Einführung in die reine Phänomenologie. Nachwort (1930), Hamburg 2009, 
68. 
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KI-Textgeneratoren können Wahrheitsgehalte erfassen und weitergeben. Ein- 
wenden muss man, dass KI-Textgeneratoren außerdem etwas widerfahren kann.” 
Ebenso, wie jedem anderen leblosen Gegenstand etwas widerfahren kann, wider- 
fahren KI-Textgeneratoren Informationsgehalte, wenn sie mit Trainingsdaten 
konfrontiert werden. Wahrheitsgehalte können ihnen demnach widerfahren. Aber 
ihnen kann nicht widerfahren, wie sie Wahrheitsgehalte als wahr erleben. Wenn 
uns als erlebende Wesen wiederfahrt, wie wir die Texte von KI-Textgeneratoren als 
wahr erleben, dann erleben wir anstelle von KI-Textgeneratoren den Widerfah- 
renscharakter von Wahrheit. 

Wir sprechen der KI quasi ein Erleben des Widerfahrnisses der Tatsächlichkeit 
von Wahrheits-Erleben zu, wenn wir über eine manipulierende KI diskutieren, weil 
wir ihr dann den Anspruch unterstellen, den wir an Aussagen über erlebtes Erleben 
von Widerfahrnissen erheben. 


4 Kurzschluss im Diskurs um KI-Textgeneratoren 


Die Situation, die durch KI-Textgeneratoren kreiert wird, ist nicht etwa, dass der 
Mensch noch nicht die Funktionen dafür ausgebildet hat, die Wahrheit von Chat- 
GPT von ihrer Lüge zu unterscheiden, oder dass KI-Textgeneratoren mit qualitativ 
besseren Informationen gespeist werden müssen, um verlässlicher Wahres auszu- 
sagen. Das Problem, das durch KI-Textgeneratoren offenbart wird, ist ein Kurz- 
schluss, nach dem das, was zu erklären ist, nämlich die Wahrheit (Explanandum), 
mit dem, was erklärt, nämlich die Wahrheitsaussagen von KI-Textgeneratoren 
(Explanans), vertauscht wird in der Debatte um Wahrheit. Anstatt zu überlegen, 
was das Spezifische an Wahrheit sein könnte, wird ein künstliches Modell von 
Wahrheit - die Texte von KI-Textgeneratoren zu Wissensfragen - als Maßstab dafür 
genommen, was Wahrheit ist. Hier wird ein Modell für Wahrheit zum Stereotypen 
gemacht und damit die Möglichkeit vereitelt, sich weiteren Ebenen von Wahrheit 
gewahr zu werden, die von Künstlicher Intelligenz nicht betreten werden können. 
Händeringend wird nach einer Erklärung gesucht, warum die KI nicht Wahres 
sprechen kann, indem in derselben Perspektive von einer auf Funktionsäquiva- 
lenten reduzierten Möglichkeit des Erkennens von Wahrheit verblieben wird. Die 
Argumentationen verstricken sich in die folgende Sackgasse: Weil eine KI als Fakten 
geltende Informationen erkennen und weitergeben kann (spätestens mit einer 
Verbesserung der Funktionalität des Programms), muss sie folgerichtig auch 
Wahres sprechen können, da sich ansonsten das gesamte Wahrheits- und Wis- 


30 Ohly 2015, 152. 
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senschaftsverständnis, das auf Informationsgehalten aufbaut, ad absurdum führt. 
Eine Gegenthese zur absichtsvollen KI bei gleichzeitiger Aufrechterhaltung einer 
Wahrheit, die vollends erkannt wird, kann in dieser Argumentation nicht plausibel 
formuliert werden. Erst wenn die funktionale Ebene der Informationsgehalte ver- 
lassen wird und sich auf eine andere kategoriale Ebene argumentativ begeben wird, 
kann über eine Unmöglichkeit der absichtsvollen Lüge in KI argumentiert werden. 

Ich plädiere dafür, dass die unterschiedlichen Ebenen von Wahrheit differen- 
ziert werden in (1) den Sachverhalt von Wahrheit (Wahrheitsgehalt), also Infor- 
mationen, die auch KI-Textgeneratoren aufbereiten können, (2) die Tatsächlichkeit 
von Wahrheit, die gegeben ist, wenn Wahrheit tatsächlich Wahrheit ist, und (3) das 
Widerfahren, dass ich Wahrheit tatsächlich als wahr erlebe. Wird Wahrheit auf 
ihren Wahrheitsgehalt reduziert, verliert sie ihren Widerfahrenscharakter und 
kann somit nicht tatsächlich wahr sein. 

Die Verlässlichkeit, dass Wahrheit Wahrheit ist verlangen Menschen von KI- 
Textgeneratoren. Doch auf was soll man sich nun verlassen können im Gespräch 
mit den KI-Textgeneratoren? Dass KI-Textgeneratoren uns nichts wiedergeben, das 
nicht mit der Faktenlage übereinstimmt, oder darauf, dass die KI uns nicht mani- 
puliert? Welche Verlässlichkeit wird tatsächlich im Diskurs gefordert? Die Ver- 
lässlichkeit der Tatsache, dass Wahrheit in ihrem Wahrheitsgehalt ist, was sie ist, 
oder dass Wahrheit wahr erlebt werden muss, um wahr zu sein? 

KI-Textgeneratoren ist jedenfalls auf mehreren Ebenen wenig Glauben zu 
schenken. Zum einen, da sie keinen Wahrheitsanspruch an ihre Aussagen erheben 
können, wenn sie kein Wahrheits-Erleben haben. Zum anderen, weil nicht einmal 
mehr auf informationeller Ebene der Tatsachenzusammenhang, dass ihre Aussagen 
den jeweiligen Sachverhalten entsprechen, verlässliche Tatsächlichkeit besitzt. 


5 Fazit 


Menschen erleben Aussagen von künstlich intelligenten Textgeneratoren als wahr. 
Ihnen widerfährt, dass künstlich intelligente Textgeneratoren Texte schreiben, 
deren enthaltene Aussagen sie mitunter als Lügen erleben. Das Problem, vor dem 
sich Menschen gestellt sehen, ist auf der einen Seite eine manipulative KI und auf 
der anderen Seite die Angst, Wahrheit nicht mehr von Lüge unterscheiden zu 
können. Es besteht eine Angst vor der allumfassenden Täuschung, dem Leben als 
Simulation. 

Der Widerfahrenscharakter von Wahrheit wird in dem Anspruch an KI-Text- 
generatoren offenbart. Die Art und Weise, Wahrheit auszusagen, die mit KI-Text- 
generatoren möglich ist (obgleich nicht verlässlich), wird als Erklärung dafür ge- 
nommen, was Wahrheit ist. Der neu entfachte öffentliche Wahrheitsdiskurs, 
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angeregt durch KI-Textgeneratoren, offenbart, dass diese Beschneidung der Wahr- 
heit um ihren Widerfahrenscharakter nun mit der Implikation von künstlichen 
Wahrheits-sprechenden Instanzen ins Wanken gerät. 

Offenbart wird ebenfalls, dass Wahrheit nicht als solche existiert (wie es im 
Diskurs anmutet), sondern dass das, was wahr ist, existiert. Wahrheit wird als wahr 
erlebt, die Ebene des Erlebens bleibt rein informationell aufgebauten Systemen 
jedoch verschlossen. Aufgrund ihrer materialen Beschaffenheit ist ihnen ein Erle- 
ben von Widerfahrnissen, ein In-Bezug-Setzen des Widerfahrens mit dem eigenen 
Erleben nicht möglich. Die KI hat keine eigene Lebenswelt. 

Texten von KI ist keine Intentionalität inhärent, allerdings wird ihnen eine 
Intentionalität zugeschrieben, wenn ihnen durch den erlebenden Menschen ein 
Wahrheitsanspruch zugesprochen wird. Der Mensch erlebt den Widerfahrenscha- 
rakter von Wahrheit in künstlich generierten Texten. Die vermeintliche Lüge eines 
KI-Textgenerators, die uns in Erklärungsnotstände versetzt, offenbart retrospektiv, 
wie wir Intentionalität zusprechen. 

Wir können verifizieren, dass künstlich generierte Texte Informationsgehalte 
enthalten, die in der allgemeinen Öffentlichkeit und Wissenschaft das aktuell vor- 
herrschende Modell einer Faktenlage widerspiegeln. KI erkennt die als Fakten 
geltenden Informationen über die Welt ebenso gut (wenn auch quantitative Diffe- 
renzen vorhanden sein können) wie ein Mensch dies kann. KI-Textgeneratoren 
bewegen sich auf der kategorialen Ebene der Information, während der Mensch 
zusätzlich die kategoriale Ebene des Erlebens von Widerfahrnissen erleben kann, 
weil auch sein Erleben einen Widerfahrenscharakter besitzt. 

Die kategoriale Unterscheidung der verschiedenen Ebene von Wahrheit ist 
meines Erachtens in der Analyse möglich und auch nötig, um nicht in argumen- 
tative Sackgassen zu geraten angesichts von Künstlichen Intelligenzen, die schein- 
bar ihre Texte als wahr erleben können. 


Didem Sedefoglu/Sandra Ohly 
Erfolgreich führen zwischen Mensch und 
Maschine 


Führungskommunikation in Zeiten generativer KI 


Abstract: In times of digitization and mobile work, the buzzword virtual leadership 
has generated momentum. Our contribution looks at the shift in communication in 
a digitized world of work, particularly in daily interactions between managers and 
employees. This shift requires leaders to effectively use digital technologies, with 
limited use of non-verbal behaviors compared to face-to-face communication. At the 
same time, the development of artificial intelligence (AI) is advancing, offering the 
potential to augment leadership in challenging areas. Our focus lies on the appli- 
cation of generative AI in communication between managers and employees. We 
shed light on the opportunities and challenges of Al-mediated leadership commu- 
nication and examine how relationships between leaders and employees evolve in 
the age of AI. Drawing on theories of business psychology, we provide an overview 
of the topic, present results from our recent study, and discuss implications for 
further research. 


1 Einleitung 


In der digitalisierten Arbeitswelt verlagert sich die Kommunikation zwischen 
Führungskräften und Mitarbeitenden zunehmend auf virtuelle Kontexte.' Daher 
besteht für Führungskräfte die Notwendigkeit, effektiv mithilfe digitaler Techno- 
logien zu kommunizieren,” was aufgrund der geringeren Reichhaltigkeit im Ver- 
gleich zur Face-to-Face-Kommunikation eine besondere Herausforderung darstellt. 
Gleichzeitig birgt die rasante Entwicklung von KI-Systemen das Potenzial, Füh- 
rungskräfte in der Kommunikation zu Unterstützen und Führung womöglich zu 
verbessern. Im neueren Verständnis von Führung nehmen KI- Assistenzsysteme 
eine wichtige Schlüsselrolle ein und werden immer häufiger eingesetzt - mit der 


1 Bradford S. Bell et al., „Leading Virtually“, Annual Review of Organizational Psychology and Or- 
ganizational Behavior, Bd. 10(1), 2023, 339-362. 

2 Christian Tuschner et al., ,Leading in the digital age: A systematic review on leader traits in the 
context of e-leadership“, ECIS 2022 Research Papers, Bd. 63, 2022, 1310. 


8 Open Access. © 2024 bei den Autorinnen und Autoren, publiziert von De Gruyter. Dieses Werk ist 
lizenziert unter einer Creative Commons Namensnennung - Nicht kommerziell - Keine Bearbeitung 4.0 International 
Lizenz. https:/doi.org/10.1515/9783111351490-027 
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steigenden Tendenz, dass Führungsaufgaben zunehmend durch KI übernommen 
werden." 

Unser Beitrag im Tagungsband soll den Fokus auf die Nutzung von Generativer 
KI in der Kommunikation zwischen Führungskräften und Mitarbeitenden lenken. 
In diesem Kontext beleuchten wir insbesondere die Chancen und Herausforde- 
rungen, die mit der KI-vermittelten Führungskommunikation einhergehen. Wir 
stellen uns die Frage, wie sich Beziehungen zwischen Führungskräften und Mit- 
arbeitenden im Zeitalter der KI entwickeln. Wir stützen unsere Argumentation 
dabei primär auf Theorien der Wirtschaftspsychologie, einer Disziplin, bei der das 
Wohlbefinden sowie Verhalten und Erleben von Menschen am Arbeitsplatz im 
Vordergrund steht. 

Den Einstieg bildet dabei ein Abschnitt, in dem zunächst die Bedeutung der 
Kommunikation im Führungskontext herausgestellt wird. Im zweiten Abschnitt 
widmen wir uns der modernen Arbeitswelt, wobei insbesondere die Veränderun- 
gen hinsichtlich der Kommunikation zwischen Führungskraft und Mitarbeitenden 
aufgegriffen werden. Im dritten Abschnitt gehen wir auf Ergebnisse einer eigenen 
empirischen Studie ein, in der wir Auswirkungen von KI auf Empathie in der text- 
basierten Führungskommunikation untersuchen. Abschließend erfolgt im vierten 
Abschnitt eine Einordnung und Diskussion der Ergebnisse vor dem Hintergrund 
wirtschaftspsychologischer Theorien, bevor auf Forschungsimplikationen einge- 
gangen wird. 


2 Kommunikation als Führungsaufgabe 


Führung ist eine zielgerichtete Einflussnahme auf andere mit Hilfe von Kommu- 
nikation.* Zu den zentralen Führungsaufgaben gehört die Delegation von Aufgaben, 
die Motivation von Mitarbeitenden und die aktive Beteiligung von Mitarbeitenden 
in Entscheidungsprozesse, wobei Kommunikation in schriftlicher oder mündlicher 
Form eine bedeutende Rolle zukommt. Tatsächlich zeigen Arbeitsbeobachtungen 
von Führungskräften, dass Kommunikation ca. 70% - 80% ihres Arbeitsalltages 
ausmacht.° Die Tätigkeit einer Führungskraft ist dabei stark fragmentiert und setzt 
sich über den Tag hinweg aus vielen kurzen Episoden zusammen, die durch un- 
terschiedliche Inhalte und Kommunikationspartnerinnen und Kommunikations- 


3 Niels van Quaquebeke/Fabiola H. Gerpott, „The Now, New, and Next of Digital Leadership: How 
Artificial Intelligence (AI) Will Take Over and Change Leadership as We Know It“, Journal of Lea- 
dership & Organizational Studies, Bd. 30(3), 2023, [https://tip.de/3z6od]. 

4 Gary A. Yukl, Leadership in organizations. Seventh Edition, Upper Saddle River 2010. 

5 Henry Mintzberg, The nature of managerial work, New York 1997. 
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partner geprägt sind. Dabei hat die Kommunikation mit Mitarbeitenden den 
größten Anteil. Neben der Kommunikation mit den Mitarbeitenden beinhaltet der 
Arbeitsalltag von Führungskräften auch die Kommunikation mit Kolleginnen und 
Kollegen auf derselben Hierarchieebene, zum Beispiel bei Verhandlungen über 
Ressourcen. Des Weiteren umfasst sie die Kommunikation mit höhergestellten 
Führungspersonen, um an Entscheidungsprozessen teilhaben zu können und diese 
zu beeinflussen. 

Führungsverhalten setzt Kommunikation voraus, unabhängig davon, ob der 
Fokus auf der Aufgabe, den Bedürfnissen der Mitarbeitenden oder anstehenden 
Veränderungen liegt (Aufgabenorientierung, Mitarbeiterorientierung und Verän- 
derungsorientierung).’ Das Führungsverhalten in den Interaktionen zwischen 
Führungskraft und Mitarbeitenden nimmt einen entscheidenden Einfluss auf die 
Beziehungsqualität zu Mitarbeitenden sowie deren Arbeitszufriedenheit.* Daher 
gilt die Kommunikationskompetenz von Führungskräften als wichtiger Indikator 
für Führungseffektivität,’ insbesondere in schwierigen Situationen wie in Konflik- 
ten, Krisen oder Veränderungsprozessen, welche im heutigen Arbeitsalltag allge- 
genwärtig sind. Basierend auf einer funktionalen Perspektive von Führung muss die 
Führungskraft in der Lage sein, flexibel auf die Bedürfnisse von Mitarbeitenden in 
verschiedenen Situationen zu reagieren, um ihre Führungsrolle erfolgreich zu be- 
wältigen.'° Kommunikation sollte dabei sowohl zielführend als auch angemessen in 
Inhalt und Form sein.'' Mit Angemessenheit ist primär gemeint, dass während der 
Kommunikation zwischenmenschliche Normen eingehalten und die Interessen und 
Bedürfnisse des Gegenübers mitberücksichtigt werden. Insgesamt zeichnet sich ab, 
dass Kommunikation ein essenzielles Element der Führungstätigkeit ist und maß- 
geblich zum Erfolg von Führung in Organisationen beiträgt. 


6 Stefan Tengblad, „Is there a ‚New Managerial Work?‘ A Comparison with Henry Mintzberg’s 
Classic Study 30 Years Later*“, Journal of Management Studies, Bd. 43(7), 2006, 1437-1461. 

7 Yukl 2010. 

8 Gary Yukl et al., „Influence of leader behaviors on the leader-member exchange relationship“, 
Journal of Managerial Psychology, Bd. 24(4), 2009, 289-299; Gary Yukl et al., „Effectiveness of broad 
and specific leadership behaviors“, Personnel Review, Bd. 48, 2019. 

9 Larry E. Penley et al., „Communication Abilities of Managers: The Relationship to Performance“, 
Journal of Management, Bd. 17(1), 1991, 57-76. 

10 Joseph E. McGrath, Leadership behavior. Some requirements for leadership training, Washington 
DC 1962. 

11 Paul E. Madlock, „The Link Between Leadership Style, Communicator Competence, and Emp- 
loyee Satisfaction“, Journal of Business Communication, Bd. 45(1), 2008, [https://tip.de/uS69n]. 
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3 Kommunikation in der modernen Arbeitswelt 


Durch die vermehrte Verbreitung von verteilter Arbeit durch global agierende 
Teams, Homeoffice und flexiblen Arbeitszeiten verändert sich der Kontext, in dem 
Führungskräfte und Mitarbeitende miteinander interagieren. Während es an- 
fänglich eher Bedenken in Bezug auf die Produktivität im Homeoffice gab, stehen 
heute eher Vorteile wie Flexibilität und reduzierte Anreisezeit im Vordergrund, 
weshalb Organisationen vermehrt mobiles Arbeiten (Homeoffice und andere Ar- 
beitsorte) unterstiitzen.’” Eine kürzlich erschienene Meta-Studie zeigt zudem, dass 
mobiles Arbeiten mit einer besseren körperlichen Gesundheit und weniger Fehl- 
zeiten der Mitarbeitenden zusammenhängt." Auf der anderen Seite zeigen Studien, 
dass mobile Arbeit mit einer verstärkten sozialen Isolierung einhergehen kann, was 
unter anderem dadurch bedingt ist, dass der persönliche Kontakt in Präsenz fehlt.'* 

Kommunikation ist in der heutigen Zeit häufig medial vermittelt und bedient 
sich unterschiedlicher Techniken wie Chats, E-Mails oder Videokonferenzen. Allen 
diesen ist gemein, dass weniger Informationen übermittelt werden, wodurch die 
Kommunikation weniger reichhaltig ist als die mündliche Face-to-Face-Kommuni- 
kation.'” Während non-verbale Hinweisreize auf Emotionen wie Lächeln, Kopfni- 
cken und Stirnrunzeln in Videokonferenzen noch übertragen werden können, 
fehlen andere Informationen, wie beispielsweise zu Körperhaltung oder Entfer- 
nung der Person, die Rückschlüsse auf momentane Zustände und Beziehungsqua- 
lität der Kommunikationspartner ermöglichen. Auch können Hinweisreize bei 
Störungen in der Signalübertragung ausbleiben oder falsch interpretiert werden, 
wenn etwa das Video ausgeschaltet wird. Fehlende non-verbale Hinweisreize sind 
eine unter mehreren Erklärungen für Zoomfatigue — Erschöpfung durch Video- 
konferenzen.'° Erste Ansätze, Gestik in Videokonferenzen zu integrieren, um für 
fehlende Signale zu kompensieren, scheinen erfolgsversprechend.’’ Verglichen mit 
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Videokonferenzen sind E-Mails noch weniger reichhaltig. Die Kommunikation er- 
folgt nicht nur ohne Bild- und Tonunterstützung, sondern häufig auch mit Zeit- 
verzug. Aufgrund dessen wird den verwendeten Wörtern und dem Inhalt der 
Nachrichten eine stärkere Bedeutung beigemessen. + 

Dies hat insbesondere Implikationen für die Kommunikation zwischen Füh- 
rungskraft und Mitarbeitenden. Anders als früher nutzen Führungskräfte in der 
mobilen Arbeit vermehrt die oben genannten Kommunikationskanäle, um Aufga- 
ben zu verteilen, Beziehungen zu pflegen oder Feedback zu geben. Studien zeigen, 
dass es im digitalen Kontext besonders herausfordernd ist, Vertrauen und Bezie- 
hungen zu Mitarbeitenden aufzubauen.'? Daher ist es essenziell, dass Führungs- 
kräfte im digitalen Zeitalter erfolgreich mithilfe von digitalen Technologien kom- 
munizieren. 


4 Empathie in der Fuhrungskommunikation 


Während in einem traditionellen Führungsverständnis wenig Raum für Emotionen 
ist, lässt die Führungsforschung in den letzten 20 Jahren ein Umdenken erkennen. 
Effektive Führungskräfte sind solche, die positive Emotionen von Mitarbeitenden 
wecken und daran appellieren, zum Beispiel in inspirierenden Ansprachen.”° Diese 
Mitarbeiterorientierung setzt zusätzlich das Erkennen und den Umgang mit nega- 
tiven Emotionen voraus.” Beispiele für relevante zwischenmenschliche Fähigkei- 
ten sind Empathie, Taktgefühl und Überzeugungsfähigkeit.”” Die Empathie be- 
inhaltet neben der Perspektivenübernahme (kognitives Hineinversetzen in die 
Situation und Sichtweise der anderen Person) auch das Hineinfühlen als emotio- 
nale Komponente.” Empathie kann dabei entweder verbal oder non-verbal (durch 
Nicken oder Lächeln) zum Ausdruck gebracht werden. Auf Verhaltensebene äußert 
sich Empathie in Äußerungen wie „Ich kann nachvollziehen, wie es Dir geht“ oder 
„Ich fühle mit Dir“. Empathische Führungskräfte schneiden in Leistungsbeurtei- 
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lungen besser ab.”* Dies ist darauf zurückzuführen, dass eine empathische Füh- 
rungskraft die Bedürfnisse der Mitarbeitenden versteht und weiß, wie sie diese am 
besten unterstützen kann. 

Auch aufgabenbezogene Führung kann durch Empathie besser geleistet wer- 
den, beispielsweise bei dem Uberbringen von negativem Feedback.” Ein Mangel an 
Empathie kann sich hingegen negativ auf die Beziehungsqualität auswirken.”® Da- 
her ist es wichtig, dass Führungskräfte sich bemühen, in der Kommunikation mit 
Mitarbeitenden ein geeignetes Maß von Empathie zum Ausdruck zu bringen. Nach 
neuesten Studienerkenntnissen ist es dabei auch entscheidend, wie häufig die 
Führungskräfte mit ihren Mitarbeitenden kommunizieren.” Wie im vorherigen 
Abschnitt thematisiert, findet die tägliche Kommunikation mit Mitarbeitenden 
vermehrt digital, zum Beispiel über E-Mail statt. Diese zeichnet sich durch einen 
Mangel an nonverbalen Signalen aus, weshalb es essenziell ist, Empathie in der 
schriftlichen Führungskommunikation zu fördern. 


5 Förderung der empathischen 
Führungskommunikation durch KI - 
experimentelle Befunde 


Mit der Entwicklung von neuen Unterstützungssystemen für intelligentes Schrei- 
ben, die basierend auf KI in Angeboten wie ChatGPT, DeeplWrite oder Gmail im- 
plementiert sind, ist eine neue Forschungsrichtung zu KI-vermittelter Kommuni- 
kation entstanden. Die grundsätzliche Frage ist hier, wie ein Mensch mit der 
Unterstützung eines sogenannten „intelligenten Agenten“ kommuniziert und wie 
dabei Nachrichten modifiziert, ergänzt oder generiert werden, um Kommunikati- 
onsziele zu erreichen.”® Es zeigt sich im Kontext der Arzt-Patienten-Kommunikati- 
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on, dass ein KI gestützter ChatBot Nachrichten generiert, die von den Experten und 
Expertinnen als empathischer eingestuft werden als Nachrichten, die von medizi- 
nischen Fachpersonal geschrieben wurden.” Dies kann neben der Wortwahl 
möglicherweise auch durch die Länge der Nachricht erklärt werden. 

Trotz dieser Befunde, die gegenwärtig noch nicht weite Verbreitung gefunden 
haben, stellt sich die Frage, wie Menschen auf KI-gestützte Kommunikation rea- 
gieren, zumal sie eine gewisse Abneigung gegenüber KI-Unterstützung bei þe- 
stimmten Aufgaben zeigen.*° Gemäß der Mind Perception Theorie nehmen Men- 
schen gemeinhin an, dass KI über weniger emotionale Fähigkeiten verfügt als 
Menschen.’ Bei Aufgaben, die eher „menschliche“ Fähigkeiten erfordern (zum 
Beispiel moralische Entscheidungen), folgen Personen eher den Anweisungen eines 
menschlichen Vorgesetzten,” während sie sich bei numerischen Schätzungen und 
Prognosen eher an den KI-Empfehlungen orientieren.” Auf dieser Basis erwarteten 
wir, dass Menschen einem KI-generierten Feedback zu ihrer Kommunikation we- 
niger folgen werden als einem menschlichen Feedback. Im Experiment sollten die 
522 Teilnehmenden in der Rolle einer Führungskraft eine E-Mail an einen fiktiven 
Mitarbeitenden schreiben, der in guter Absicht einen gravierenden Fehler began- 
gen hatte. Alle Teilnehmenden bekamen das Feedback, diese E-Mail sei nicht em- 
pathisch genug, sie sollten daher die E-Mail noch einmal verbessern. Einer Gruppe 
wurde mitgeteilt, die E-Mail sei durch einen menschlichen Kommunikationsex- 
perten bewertet worden, auf dessen Bewertung das Feedback beruhe. Die andere 
Gruppe bekam die Bewertung und somit das Feedback vorgeblich durch eine spe- 
zialisierte KI. Nur Personen, die ihre E-Mail angepasst hatten, wurden in die an- 
schließende Analyse einbezogen. Entgegen unserer Erwartung verbesserten sich 
beide Untersuchungsgruppen gleichermaßen im Ausmaß der in der E-Mail gezeig- 
ten Empathie. Dieses Ergebnis spricht dafür, dass Menschen einer KI zutrauen, 
Empathie korrekt erkennen zu können, sodass sie ihr Verhalten daran ausrichten. 
In der Folge könnte es dazu kommen, dass man nicht nur dem Feedback folgt, 
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sondern auch eher bereit ist, KI gestützte Systeme selbst anzuwenden, um E-Mails 
zu schreiben. 

Interessant ist an dieser Stelle auch der Vergleich einer durch ChatGPT 3.5 ge- 
nerierten E-Mail auf den Prompt, der die gleiche Aufgabenstellung wie im Experi- 
ment enthielt. Hier zeigt sich, konsistent mit der Studie in der Medizin zur Arzt- 
Patienten-Kommunikation, eine höhere Wortlänge und insgesamt mehr empathi- 
sche Äußerungen als die durch Menschen generierten E-Mails. Initial verwendete 
ChatGPT nur Äußerungen der kognitiven Empathie („Ich verstehe, dass Sie unter 
Zeitdruck standen“), aber keine Äußerungen der affektiven Empathie. Wenn man 
erneut promptet und ähnlich wie im Experiment das Feedback gibt, die E-Mail sei 
nicht empathisch genug, werden affektive Äußerungen zusätzlich eingebaut („Ich 
schätze Ihr Engagement‘). 


6 Implikationen für Motivation und 
Beziehungsqualität in der Arbeit 


Gemäß der Selbstbestimmungstheorie** sind Menschen autonom motiviert, ihren 
jeweiligen Tatigkeiten (Schulaufgaben, berufliche Aufgaben, Freizeit) nachzugehen, 
wenn ihre grundlegenden Bediirfnisse nach Kontrolle, Kompetenzerleben und so- 
zialer Bezogenheit erfüllt werden. Kontrolle wird dann erlebt und das entspre- 
chende Bedürfnis befriedigt, wenn eine Person sich selbst als Ursache ihres Han- 
delns erlebt und nicht andere Personen oder höhere Mächte. Das Bedürfnis nach 
Kompetenzerleben beruht auf einem erfolgreichen Ergebnis eigener Handlungen 
sowie dem Streben nach persönlicher Weiterentwicklung. Soziale Bezogenheit 
schließlich wird erlebt, wenn sich Personen als Teil einer sozialen Gruppe sehen 
und Gemeinschaft mit anderen erleben. 

Studienergebnisse aus dem Arbeitskontext zeigen, dass die Erfüllung der drei 
Grundbedürfnisse über die Motivation hinaus auch mit einem gesteigerten Wohl- 
befinden und gesteigerter Leistung an der Arbeit einhergeht.” In Anbetracht des- 
sen sollte die Gestaltung von Arbeitsplätzen darauf abzielen, dass die Bedürfnis- 
befriedigung von Mitarbeitenden gewährleistet wird. So sollte beispielsweise 
darauf geachtet werden, dass Mitarbeitende über genügend Handlungsspielraum 
verfügen, an Entscheidungen beteiligt werden sowie Gelegenheiten erhalten, sich 
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beruflich weiterzuentwickeln. Weiterhin sollte das Gemeinschaftsgefühl am Ar- 
beitsplatz gefördert werden, zum Beispiel durch Teambuilding-Aktivitäten. 

Analog kann die Selbstbestimmungstheorie als ein Anhaltspunkt dienen, die 
Folgen des Einsatzes von KI in der Kommunikation von Führungskräften und Mit- 
arbeitenden abzuschätzen und theoretisch einzuordnen. Daraus resultieren wich- 
tige Anschlussfragen, die in zukünftiger Forschung adressiert werden müssen. Zu 
unterscheiden sind hier zunächst die Sender- und die Empfängerperspektive, in 
unserem Fall die Perspektive der Führungskraft und die des Mitarbeitenden. Als 
Sender (Führungskraft) besteht bei KI-gestützten Empfehlungssystemen die Mög- 
lichkeit, Empfehlungen wie „Schreibe empathischer“ zu folgen oder auch nicht, was 
die wahrgenommene Kontrolle erhöhen sollte. Entscheidend wird hier in Zukunft 
sein, wie Systeme gestaltet werden, die KI-vermittelte Kommunikation ermöglichen. 
Aus psychologischer Sicht sind mit Blick auf die Selbstbestimmungstheorie unbe- 
dingt Wahlmöglichkeiten zu implementieren, was zum Beispiel bedeuten kann, 
dass Personen selbst entscheiden können sollten, ob Sie einer Empfehlung der KI 
folgen. Weiterhin kann die Motivation, ein KI-System zu nutzen, davon abhängig 
sein, ob die KI eher als unterstützend oder als übergriffig für die eigene Autonomie 
wahrgenommen wird. Mit Blick auf das Bedürfnis nach Kompetenz und der 
wahrgenommenen Kompetenz bleibt gegenwärtig offen, wie sich diese im Fall des 
Sendens einer KI-gesttitzten Nachricht auswirkt. Denkbar ist, dass KI-Systeme ins- 
besondere dann als förderlich wahrgenommen werden, wenn sie eine Kongruenz 
zu den Wachstumszielen des Individuums aufweisen. Auf unser Beispiel bezogen 
könnte das bedeuten, dass insbesondere diejenigen Führungskräfte das Feedback 
der KI schätzen, die das Zeigen von Empathie gegenüber Mitarbeitenden grund- 
sätzlich als wichtig erachten. In Bezug auf das Bedürfnis nach Bezogenheit lässt sich 
spekulieren, dass KI-gestützte Nachrichten zu einer stärkeren Bedürfnisbefriedi- 
gung beitragen, weil sie im Ton positiver ausfallen. Auf der anderen Seite könnte es 
ein Empfänger negativ wahrnehmen,?® wenn sich der Sender selbst wenig Mühe 
gibt, um einen empathischen Text zu schreiben. Kritisch ist möglicherweise auch 
der Einsatz von KI bei Nachrichten mit hohem Emotionsgehalt, wie zum Beispiel 
Entschuldigungen. Erste Studien deuten darauf hin, dass die Nutzung von Kl hier zu 
einer negativen Wahrnehmung der Authentizität sowie Ernsthaftigkeit führen 
kann.” Die Wirkung von Kl-gestützter Kommunikation auf die Führungskraft- 
Mitarbeitenden-Beziehungen bedarf daher weiterer Forschung. 
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Roland Kunz 
Transformer - Textgenerierung, 
Industrieanwendungen und Grenzen 


Abstract: Transformer based neuronal networks, engine ofthe Generative Alwave, 
promise a new and more powerful method of generating text, images, and sound. 
All over the industry, companies are evaluating the proper use of this new tech- 
nology and the associated risks and benefits. This paper will discuss the current 
industry trends and observations, as well as the limitations of that architectural 
approach. Considerations on where to engage on this journey are discussed as well 
as some practical limitations. 


1 Einführung 


Anwendungen im Bereich Künstlicher Intelligenz (KD,* welche auf dem Konzept der 
sogenannten General Pretrained Transformers (GPT) beruhen,” haben in der In- 
dustrie eine breite Resonanz verursacht,’ ermöglichen sie doch eine wesentlich 
breitere Anwendung, als vorher existierende Lösungen. Diese als generative KI 
Anwendungen (Generative AI) bezeichneten Systeme sind insbesondere durch Lö- 
sungen wie Chat-GPT bekannt geworden.“ Als Beispiel für die Relevanz für Industrie 
und bei der Suche nach den richtigen Ansätzen sei hier eine Gartner-Studie zu 
erwähnen, in der weltweit Kunden zu diesem Thema befragt wurden. Hier zeigt 
sich, dass bereits fast die Hälfte ihre KI-Investitionen allein aufgrund des Potenzials 
von Chat-GPT und generativen KI-Anwendungen erhöht haben. In drei Jahren - so 
diese Gartner Untersuchung - wird erwartet, dass mehr als 60% der Anwendungen 
wie Telefon-, Web- oder Windows-Apps automatisch durch KI-Codierung, Pro- 
grammierung und generative Funktionen erstellt werden.’ Das Versprechen dieser 
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Lösungen für die Industrie liegt hierbei in der Automatisierung und Produktivi- 

tätssteigerung, nach der Unternehmen suchen. Ebendies wurde auch in einer 

weiteren Studie von Bloomberg und ARK Investment bestätigt. Diese Studie sagt, 

dass Unternehmen mit vielen qualitativ hochwertigen Daten besonderen Nutzen 

und Wettbewerbsvorteile aus dieser Technologie ziehen werden können. Weiterhin 

ist es für Unternehmen essentiell, die Balance zwischen dem Zeitpunkt des Einstiegs 

und der Größe der Investition auf der einen und der Lernkurve durch die adaptive 

Einführung in der Organisation auf der anderen Seite abzuwägen. Insbesondere seit 

und durch die Adaption von generativer KI und trotz diverser externer Einflüsse 

wie Inflation und politische Konflikte ist dieser Markt ein sehr schnell wachsender. 
Die Abschätzung, wie stark dieser Markt wachsen wird und was Führungs- 

kräfte in der Industrie sagen, ist hier aufgelistet: 

- Kl wird 15.7 Milliarden Dollar zur Weltwirtschaft im Jahr 2030 beitragen 

- 45% aller Führungskräfte erhöhen ihre Investitionen, auch aufgrund von 
ChatGPT’ 

- 73% aller CTOs sehen die Rolle von KI innerhalb ihrer Unternehmen in den 
nachsten 2 Jahren als essentiell an. 

- 75% aller großen Unternehmen werden KI nutzen, um ihre Effizienz und 
Qualitat zu steigern.® 


Auch eigene Untersuchungen von Dell Technologies bei 200 Führungskräften in- 
nerhalb der IT zeigen, dass 91% generative KI zu Hause und 71% diese auf der 
Arbeit nutzen.’ 


2 Anwendungsbeispiele in der Industrie 


Basierend auf der deutlich gestiegenen Leistungsfähigkeit heutiger Computer und 
der Beschleunigung von KI Anwendungen," sind auch die Anwendungsbeispiele 
innerhalb vieler Unternehmen und Branchen deutlich gestiegen. 
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Stand dieser Publikation sind bereits einige Unternehmen erfolgreich damit, 


generative KI in ihren eigenen Softwareprodukten einzusetzen,’ aber auch wenn 
generative KI genutzt werden kann, um menschliche Interaktion und schlussend- 
lich Arbeitskraft einzusparen, geht die Tendenz der meisten Analysten in die 
Richtung, sie dort einzusetzen, wo diese KI repetitive Aufgaben identifizieren und 
ersetzen kann. Diese umfassen die im folgenden aufgezeigten Felder: 


Digitale Assistenten im Bereich Vertrieb, Sicherheit, Infrastruktur, Retail und 
Business Oprations. Diese helfen Prozesse zu beschleunigen. Dies wird insbe- 
sondere durch den schnelleren Zugriff auf die richtigen Daten und die Mög- 
lichkeit, neue Daten zu trainieren erreicht. Beispiele seien hier Suchanfragen, 
Empfehlungen und Kundenvorlieben. 

Entwickler sind in der Lage, effizienter Code oder User Interface (UI) und User 
Experience (UX) Designs zu erstellen. Dies erhöht nicht nur die Produktivität, 
sondern hilft, früher in das Produktdesign und die Realisierung einsteigen zu 
können. Zusätzlich sinkt die Anzahl der Fehler in automatisch generiertem 
Code, was ein wesentlicher Aspekt für mehr Sicherheit ist. 

Vertrieb und Marketing können über die Erstellung von kreativen Inhalten und 
Vertriebsskripten eine hohe Bandbreite an Kommunikationsmitteln nutzen, 
um mit ihren Kunden in Kontakt zu kommen. Dies beinhaltet nicht nur Text, 
sondern auch Audio, Video, Bilder, Podcasts, Videospiele und andere Anwen- 
dungen. Hierdurch wird die Skalierung als auch die Qualität erhöht. 

Für Forschung, Wissenschaft und Lehre kann es einen Vorteil bei der Erstel- 
lung von technischen Dokumenten im Hinblick auf Genauigkeit und Ge- 
schwindigkeit der Veröffentlichung bis hin zum Gutachten mit sich bringen. 


Auch für diese Publikation wurde der letzte Punkt der vorherigen Aufzählung 


anhand eines Experiments mit ChatGPT durchgeführt. Hierbei wurde dem Tool die 
Frage nach Anwendungsbeispielen im Bereich Finanzdienstleistungen genannt, 
und als Antwort die in folgender Abbildung 1 dargestellten Ergebnisse geliefert. 
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Generative Al models can analyze large volumes of historical transaction data to identify patterns and anomalies 
Fraud detection associated with Feuer = seat from past fraudulent instances, these models can generate synthetic 
data that mimics fraudulent vior, helping financial institutions improve their fraud detection capabilities. 


nes modes can. can assist in generating synthetic financial market data, including stock prices, order books, and 
Trading These synthetic datasets can be used to backtest trading salopes optimize algorithmic trading 
mee ne market conditions to identify potential investment opportunities. 


Generative Al can aid in risk assessment by generating synthetic data to simulate different scenarios and stress 
Risk assessment tests. By generating a range of potential outcomes, financial institutions can evaluate their exposure to market 
volatility, cı redit risk, and other uncertainties. This helps in building robust risk models and making informed decisions. 


Generative models can generate diverse synthetic asset price scenarios, allowing financial MIC essionale to assess 
Portfolio optimization the impact of various market conditions on portfolio performance. By optimizing based on these scenarios, 
investors can improve risk-adjusted returns and make more informed asset allocation decisions. 


Personalized financial 


Generative Al can assist in generating personalized financial plans for individual clients. oy aan 
financi: , generative models can si simulate future scenarios, such as retirement planning, tax optimiza’ 
investment strategies tailored to specific goals and risk profiles. 


lanning 
Customer service Generative Al can power conversational agents and chatbots in financial services, enhancing customer service 
hatbot experiences. These models can generate human Ske responses to customer inquiries, provide personalized financial 
chatbots advice, ey support tasks such as account management, loan applications, or investment guidance. 


Generative models can aid in detecting money laundering activities by generating synthetic data that emulates 
‘suspicious transactions. These models can assist in training AML systems, Baron financial institutions to identify 
and prevent illicit financial activities more effectively. 


Generative Al can be used in NLP applications to automate tasks such as document rization, sentiment 
analysis, news aggregation, and market sentiment prediction. This can help financial Iproteesionals Gate insights 
from vast amounts of unstructured data, facilitating quicker and more informed decision-making. 


Karge Donks do R hol sone are, developement. GenAl has been proved to vastly improve the productivity and quality 
of software development, with an expected up to 10x Increase in coding productivity output of software engineers by 


Abbildung 1: Ergebnisse von ChatGPT auf die Frage nach Use Cases für die Finanzbranche, durchgeführt 
von Dell Technologies im Mai 2023 auf englischer Sprache." 


3 Transformer - Basis und Status 


Die Möglichkeiten solcher Lösungen auf Basis von generativer KI und Trans- 
formern sind also groß — wie aber sieht es mit der Handhabbarkeit und der Nutzung 
aus? Transformer, die Basis von solchen Modellen, sind keine einfachen Konstrukte, 
sondern komplexe Abfolgen von Algorithmen, die dem Ziel dienen, eine statistisch 
sinnvolle Abfolge von Worttokens zu generieren. Hierbei werden Bausteine wie 
Satz- und Wordklassifizierung, die Beantwortung von Fragen oder das Ausfüllen 
von fehlenden Satzteilen benutzt ebenso wie die komplette Synthese eines Textes, 
dessen Übersetzung und Zusammenfassung. Der Transformer ist eine Art Motor der 
eigentlichen Anwendung, und daher streben viele kommerzielle und nicht-kom- 
merzielle Unternehmen und Institute nach dem besten Basismodell. Eine von der 


12 Prompt: „List the most important use cases for the financial services industry for generative AI“, 
Open AI, in [https://openai.com/chatgpt] (Zugriff: 13.05.2023). 
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Website LifeArchitect.ai'° veröffentlichte Zusammenfassung der aktuellen Modelle, 
zeigt hierbei, dass ein Streben nach dem größten Modell im Gange ist, wie in Ab- 
bildung 2 zu sehen ist. Größeren Modellen wird hierbei eine bessere Fähigkeit zur 
Abstraktion zugeschrieben. 


LANGUAGE MODEL SIZES TO MAR/2023 


Luminous 
008 


GLM-130B 


ChatGLM- 6B 


Jurassic-1 


1788 


Abbildung 2: Größe aktueller Transformer Modelle. Die Zahl innerhalb der Kreise (zum Beispiel 
530B) beschreibt die Anzahl der zu trainierenden Parameter (Billons = Milliarden). 


4 Industrieüberlegungen 


Wie im vorherigen Abschnitt gezeigt, setzt die Nutzung von generativer KI unter 

Verwendung von Transformern ein gewisses Maß an Planung voraus. Insbesondere 

der Grad der Fertigungstiefe, also wie viel die Kunden an eigener Leistung ein- 

bringen wollen, ist hierbei von Relevanz. Prinzipiell kann man hierbei drei ver- 
schiedene Ansätze unterscheiden: 

1. Kunden konsumieren ein Angebot in einer Cloud oder betreiben das Angebot in 
Form eines fertigen Produktes bei sich in der eigenen Umgebung. Dieser „In- 
ferenz“ genannte Teil des Lebenszyklus von KI erfordert die geringsten An- 
forderungen an die eigene Infrastruktur. Lediglich die Art, den Dienst zu 
konsumieren, ist festzulegen. Sei es als „Software as a Service“, wie zum Bei- 


13 Alan D. Thompson, Interne Sprachmodelle (von GPT-4 bis PaLM), in [www.ifearchitect.ai/models] 
(Zugriff: 06.10.2023). 
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spiel durch Nutzung der APIs oder der Oberfläche von ChatGPT, als Instanz 
einer großen Cloud, zum Beispiel Microsoft Azure oder im eigenen Betrieb. 
Hierbei müssen die bereits früher trainierten Daten verwendet werden. Nicht 
selten nutzen diese Modelle den weiteren Input der Nutzer für weitere Trai- 
nings. In Bezug auf eigene Daten muss hier also sehr sorgsam abgewogen 
werden, da unter Umständen Unternehmenswissen Teil der neuen Trainings- 
daten werden können, und somit prinzipiell anderen Unternehmen zur Ver- 
fügung stehen könnten. 

2. Kunden trainieren ihr eigenes Transformer basierendes Large Language Mo- 
dell mit ihren eigenen Daten und potentiell öffentlich verfügbaren allgemeinen 
Daten. Hierzu besteht neben der Notwendigkeit, hinreichend viele eigene Daten 
in guter Qualität zu haben, auch die Anforderung an eine sehr leistungsfähige 
Infrastruktur. Diese Investition ist gründlich zu bedenken, bevor ein eigenes 
System trainiert wird. Ein solches System stellt allerdings prinzipiell die beste 
Möglichkeit dar, externen Bias zu vermeiden und eigene, private Daten zu 
schützen. Ein so trainiertes Modell kann dann natürlich zur Inferenz genutzt 
werden. 

3. Kunden nehmen ein existierendes Modell, welches mit generischen Daten 
trainiert wurde, und trainieren es mit eigenen Daten weiter. Aus dem bis dahin 
öffentlichen Modell wird ein privates — mit dem Schutz der eigenen Daten, aber 
der Unsicherheit in Bezug auf möglichen Bias der Ursprungsdaten. 


4.1 Herausforderungen der Technologie 


GPT3 ist ein gut dokumentiertes Modell” und soll hier als Beispiel dienen, was für 
jeden der oben genannten Möglichkeiten (Training, Finetuning, Inferenz) notwen- 
dig wäre, wenn ein Unternehmen ebendieses nutzen will. Unter der Annahme 
hinreichend guter Daten und dem Versuch, solch ein Modell selber zu trainieren, 
bedeutete dies: 

Pro Parameter des Netzwerkes und zu lernendem Token müssen 6-8 flops 
(floating point operations per second) an Rechenleistung angesetzt werden. Die 
Anzahl der Rechenschritte ist proportional zu der Anzahl der Parameter und der zu 
trainierenden Token. Bei einer Größe von 175 Milliarden Parametern und 300 Mil- 
liarden Tokens’° ergibt sich also ein theoretischer Rechenbedarf von 

175.10° * 300.10°° * 8 flops = 0.4.10% flops 


14 Min Zhang/Juntao Li, „A commentary of GPT3“, MIT Technology Review2021, in [https://tip.de/ 
s4q6o] (Zugriff: 06.10.2023). 
15 Wikipedia, „GPT-3“, in [https:/en.wikipedia.org/wiki/GPT-3] (Zugriff 12.10.23). 


Transformer - Textgenerierung, Industrieanwendungen und Grenzen —— 453 


Zum Berechnen dieser Parameter werden aktuell vor allem NVIDIA GPUs des 
Typs A100 oder H100 verwendet. Die A100 hat dabei im Bereich Bfloat16 eine 
theoretische Leistung von 312 tflops/s.'° Die tatsächliche Leistung kann hier nur 
geschätzt werden, da Benchmarks nicht mit dem wirklichen Training gleichzuset- 
zen sind. Bei 40-50 % Effektivität wird also ein Wert von etwa 125 tflop/s angesetzt. 
Eine einzelne Karte würde also 

0.410% / 125.10° = 3.2.10° s 

Rechenzeit benötigen, was umgerechnet 37037 Tage sind. Unter der Annahme 
linearer Skalierung würde ein System bestehend aus 256 Knoten mit je 8 solcher 
GPUs ein solches Modell in 20 Tagen trainieren. Nutzt man die leistungsfähigere 
H100 GPU, würden statt 256 Knoten nur noch 80 benötigt werden, aber selbst diese 
Anzahl stellt in Bezug auf die Infrastruktur einen erheblichen Aufwand dar. 

Ein typisches System für solch ein Training ist der Dell PowerEdge XE9680,'7 
welcher 8 GPUs vom Typ H100 zur Verfügung stellt, 6 Höheneinheiten in einem 
Standard Rack belegt und je nach restlicher Ausstattung bis zu 11.5 kW Stromauf- 
nahme hat. Ein durchschnittliches Rack in einem typischen Europa liefert 15 kW,'? 
so dass hier bereits für viele Kunden eine Herausforderung besteht. 

Betrachten wir hierzu beispielhaft die Energiekosten, die der Betrieb eines 
solchen Systems benötigt. In der EU lag der durchschnittliche Strompreis im Jahr 
2023 bei ungefähr 30ct/kWh” und unter Verwendung eines Effizienzfaktors von 1,5 
(PUE für luftgekühlte Rechenzentren)” kommt man zu Stromkosten von 

11.5 kW/h * 80 * 1,5 * 0.30 = 28k€ 

Je nach Land und Jahreszeit sind das durchschnittlich 300geqCO?/kWh CO? 
Emission bei einer Bandbreite von 50-800geqCO”/kWnh. 

Diese Herausforderungen lassen erwarten, dass die meisten Kunden eher In- 
ferenz oder fortgesetztes Training (Finetuning) nutzen werden. 

Jedoch ist nicht nur die schiere Größe eines LLMs ein Erfolgsgarant. Mittler- 
weile gibt es viele Bestrebungen, kleinere, optimierte Systeme zu konstruieren. Ein 
Beispiel ist das spezialisierte System BloombergGTP.” 


16 NVIDIA, in [https:/tip.de/so7go] (Zugriff 12.10.2023). 

17 DELL, in [https:/www.dell.com/en-us/shop/ipovw/poweredge-xe9680] (Zugriff 12.10.2023). 

18 Bernhard Rohleder, Mehr Daten — mehr Strom? Wie sich Rechenzentren in Deutschland entwi- 
ckeln, 2022, in [https://tip.de/dt3gb] (Zugriff: 06.10.2023). 

19 Stefanie Schäffer, Strompreise Europa 2023 - Was kostet Strom in der EU?, in [wwwenergiema 
rie.de/strompreis/europa] (Zugriff: 06.10.2023). 

20 PUE Wert - der Indikator für die Effizienz eines Rechenzentrums, 2023, in [https:/wwwtip.de/ 
3eu2m] (Zugriff: 06.10.2023). 

21 Katharina Buchholz, ONE MILLION USERS. Threads Shoots Past One Million User Mark at 
Lightning Speed, 2023, in [www.tip.de/z7xnw] (Zugriff: 09.09.2023). 
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Dieses Modell ist mit 50 Milliarden Parametern deutlich kleiner als die stetig 
wachsenden Modelle etwa von OpenAl, es wurde auch mit spezialisierten Daten, 
bestehend aus 700 Milliarden Tokens englischer Finanzpublikationen und allge- 
meiner Information trainiert. Im Vergleich zu GPT3 ein deutlich kleineres Modell, 
aber mit mehr Tokens. 

Insgesamt ist eine Diversifizierung von Modellen durch die OpenSource Com- 
munity zu erkennen, so dass kleinere, spezialisiertere Modell zu erwarten sind. 


4.2 Spezialisierung und Voraussetzungen 


Neben dem Betrieb eines solchen Systems ist eine weitere Herausforderung die 
Verfügbarkeit von Spezialisten, um ein solches System den eigenen Bedürfnissen 
anzupassen. Ein Vortrainiertes LLM, was zum Beispiel mit 1 Milliarde Tokens 
trainiert wurde, muss für die eigene Anpassung mit einigen eigenen Daten trainiert 
werden. Dies geschieht oft durch Prompt und Response Trainings, die überwacht 
werden anhand von Demonstrationsdaten. Ein so trainiertes System muss dann 
Vergleichsdatensätze durchlaufen und wird mit Reinforcement Learning weiter 
abgestimmt. 

Weiterhin muss gewährleistet werden, dass das System keine sachlich falschen, 
oder unethischen Antworten gibt. Dies wird in der Regel über so genannte Gu- 
ardrails erreicht, die dem System die Prompts vorgeben und die Nutzereingaben 
prüfen. Auch ist der Bias eines solchen Modells immer ein Punkt, der mit betrachtet 
werden muss. 


5 Fazit 


Der Einsatz von Large Language Modellen auf Basis der Transformer Architektur ist 
für jedes Unternehmen derzeit ein Thema in Bezug auf Nutzen, Wettbewerbsvor- 
teile und Investition. Diese disruptive Technologie bietet Chancen im Wettbewerb, 
aber auch Risiken, die es abzuwägen gilt. 


Haimo Stiemer/Evelyn Gius/Dominik Gerstorfer 
Künstliche Intelligenz und 
literaturwissenschaftliche Expertise 


Abstract: Based on Heinrich von Kleist’s essay „On the Gradual Production of 
Thoughts During Speech“, this article discusses the extent to which his ideas can be 
adapted to the current debates on artificial intelligence (AI) and large language 
models (LLMs). Despite the opacity of LLMs, they are powerful tools. Therefore, the 
article argues for their assertive integration into the practice of literary studies 
serving as sparring partners in teaching, as assistants or as co-creative partners in 
research. First, the article deals with the problems and conditions that arise when 
the ChatGPT language model is used to retrieve literary knowledge. It then presents 
and reflects on examples of its use in the teaching of literature at the university 
level. Finally, the implications of AI for literary studies as a discipline are discussed. 


„Wenn du etwas wissen willst und es durch Meditation nicht finden kannst“, 
schreibt Heinrich von Kleist im Jahr 1805, ,so rate ich dir, mein lieber, sinnreicher 
Freund, mit dem nächsten Bekannten, der dir aufstößt, darüber zu sprechen. Es 
braucht nicht eben ein scharfdenkender Kopf zu sein, auch meine ich es nicht so, als 
ob du ihn darum befragen solltest: nein! Vielmehr sollst du es ihm selber allererst 
erzahlen.“ Der mit diesen Sätzen beginnende, in der Germanistik viel diskutierte? 
Essay Kleists trägt den Titel „Über die allmähliche Verfertigung der Gedanken beim 
Reden“ und resümiert Beispiele, bei denen anspruchsvolle Denkleistungen durch 
den Akt der Rede befördert beziehungsweise erbracht werden. Die Rede ist dabei 
eingebunden in eine vermeintlich dialogische Situation und bleibt doch Selbstge- 
spräch wie -aufklärung. Der Erkenntniszuwachs beim Redner ergibt sich also nicht 
aus der Kommunikation im eigentlichen, den Gedankenaustausch mit den Ge- 
sprachspartner:innen suchenden Sinn. Vielmehr versetzt ihn bereits deren Anwe- 
senheit während seines Monologs zu einem bestimmten Moment in den für die 


1 Heinrich von Kleist, „Über die allmähliche Verfertigung der Gedanken beim Reden“, in Sämtliche 
Werke und Briefe in vier Bänden, Bd. 3, Erzählungen/Anekdoten/Gedichte/Schriften, hg. von Ilse-Marie 
Barth et al., Frankfurt a.M. 1990, 534-540, 534. 

2 Vgl. u.a. Gabriele Kapp, „Die Verortung des Aufsatzes: ‚Über die allmähliche Verfertigung der 
Gedanken beim Reden‘, in „Des Gedankens Senkblei“. Studien zur Sprachauffassung Heinrich von 
Kleists 1799-1806, hg. von ders., Stuttgart/Weimar 2000, 289-311; Rüdiger Campe, „Verfahren. Kleists 
Allmähliche Verfertigung der Gedanken beim Reden“, Sprache und Literatur, Bd. 43(2), 2012, 2-21. 


8 Open Access. © 2024 bei den Autorinnen und Autoren, publiziert von De Gruyter. Dieses Werk ist 


lizenziert unter einer Creative Commons Namensnennung - Nicht kommerziell - Keine Bearbeitung 4.0 International 
Lizenz. https:/doi.org/10.1515/9783111351490-029 
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Erkenntnis notwendigen Erregungszustand.” Mit Blick auf die ursprünglich fran- 
zösische Redewendung, nach welcher der Appetit beim Essen komme („lappetit 
vient en mangeant“), konstatiert Kleist: die Idee kommt beim Sprechen („l’idee vient 
en parlant“). 

Inwiefern kann Kleists „Modell spontaner sprachlicher Performanz““ aber in 
Bezug auf die gegenwärtigen Debatten um Künstliche Intelligenz (KI) und große 
Sprachmodelle (Large Language Models, LLMs) aktualisiert werden? Oder genauer 
gefragt: Welche kognitiven Leistungen sind möglich, wenn der „nächste[...] Be- 
kannte[...]* und Gesprächspartner ein GPT-basierter Chatbot ist? In der von der 
Veröffentlichung von ChatGPT durch das Unternehmen OpenAl angeregten Debatte 
um die Potentiale, aber auch Begrenzungen von Sprachmodellen wurde immer 
wieder das Bild des stochastischen Papageis bemüht.’ Denn die KI generiert in Form 
neuronaler Netze auf Basis von Trainingsdaten statistisch ähnlichen Output und 
imitiert auf diese Weise das menschliche Sprachverhalten. Die Chat-Funktion des 
Programms erschafft weiterhin eine dialogische Situation, in der die Nutzer:innen 
mit Nachfragen oder auch Widerspruch auf die vom KI-Chatbot generierten Ant- 
worten reagieren können. Wenn wir abermals mit Kleist sprechen, so ist dieser 
stochastische Papagei vielleicht „kein scharfdenkender Kopf“, mit ihm können aber 
durchaus komplexe Konversationen geführt werden. In diesem Beitrag soll deshalb 
dargelegt und diskutiert werden, welche Anwendungsmöglichkeiten sich für 
Sprachmodelle in der akademischen Forschung und Lehre anbieten, wobei dies aus 
einer literaturwissenschaftlichen Perspektive geschehen soll. Hierfür sollen zu- 
nächst kursorisch die Bedingungen und Probleme erläutert werden, die sich im 
akademischen respektive literaturwissenschaftlichen Kontext beim Einsatz von 
Large Language Models ergeben (1.). Im Weiteren werden wir Anwendungsbeispiele 
für die literaturwissenschaftliche Lehre präsentieren, die im fortext lab an der TU 
Darmstadt konzipiert wurden (2.), um letztlich, auch als Fazit, die aus unserer Sicht 
möglichen Auswirkungen der KI auf die Literaturwissenschaft als Disziplin bezie- 
hungsweise die mit KI verbundenen Herausforderungen für sie zu skizzieren (3.). 


«4 


3 Vgl. Peter Philipp Riedl, „Über die allmählige Verfertigung der Gedanken beim Reden. An R. v. L.“, 
in Kleist-Handbuch. Leben - Werk - Wirkung, hg. von Ingo Breuer, Stuttgart/Weimar 2013, 150-152, 
151. 

4 Riedl 2013, 151. 

5 Emily M. Bender et al., „On the Dangers of Stochastic Parrots: Can Language Models Be Too Big?“, 
in FAccT ’21: Proceedings of the 2021 ACM Conference on Fairness, Accountability and Transparency, 
hg. von Association for Computing Machinery (ACM), New York 2021, 610-623, in [https://dl.acm.org/ 
doi/10.1145/3442188.3445922] (Zugriff: 06.10.2023). 
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1 Die literaturwissenschaftliche Expertise von 
ChatGPT 


Wenn wir der Frage nachgehen, inwiefern ein großes Sprachmodell wie Chat GPT3 
oder -4 literaturwissenschaftliche Expertise bereithält und inwiefern diese abruf- 
bar ist, gilt es vorab zu klären, was unter dieser Expertise zu verstehen ist. In einer 
sehr grundlegenden Bestimmung kann hierunter ein Set von rezeptiven und pro- 
duktiven Textumgangsformen verstanden werden, das auf der Basis nicht nur an- 
erkannter fachwissenschaftlicher Methoden und Kategorien, sondern auch lite- 
rarhistorischen Wissens erkenntnisstiftend auf literarische Texte angewendet 
wird.‘ Die Begriffsbestimmung wird gleichwohl prekär, wenn sie im Hinblick auf 
den Methoden- und Theoriepluralismus innerhalb der Literaturwissenschaft prä- 
zisiert werden soll. Selbst bei der im Selbstverständnis der klassischen Literatur- 
wissenschaft sicherlich zentralen hermeneutischen Praxis (im weitesten Sinn der 
Interpretation von Texten) besteht Uneinigkeit darin, welches spezifische Auf- 
merksamkeitsverhalten und damit welche kon-, ko- oder intratextuellen Aspekte 
besonders erklärungswirksam und also interpretationsrelevant sind.” Wenn wir 
zunächst jedoch von der grundlegenden Auffassung von der Expertise als fach- 
wissenschaftlich fundierten, literarhistorisch geschulten Umgang mit literarischen 
Texten ausgehen, bleibt zu klären, welche Komponenten dieser Expertise zu wel- 
chem Zeitpunkt in der literaturwissenschaftlichen Praxis von großen Sprachmo- 
dellen bereitgestellt werden beziehungsweise bei welchen sie sekundieren können. 
Bei der Verwendung von ChatGPT-3.5 fällt die Antwort bei Prompts, mit denen li- 
terarhistorisches Wissen abgefragt wird, vorerst ernüchternd aus. Das über 
Prompts abgerufene Wissen besteht häufig aus einer Melange aus Fakten und 
Fiktion, wird allerdings durchaus eloquent präsentiert. Der Papagei kommt hier 
also an seine Grenzen und halluziniert mitunter, wie es in der Diskussion um KI- 
Chatbots heißt. 


6 Vgl. Steffen Martus, „Interpretieren — Lesen — Schreiben. Zur hermeneutischen Praxis aus lite- 
raturwissenschaftlicher Perspektive“, in Hermeneutik unter Verdacht, hg. von Andreas Kablitz et al., 
Berlin/Boston 2021, 45-81; Walter Erhart, „Was wollen Philologen wissen? Über Praktiken und 
Passionen der Literaturwissenschaft“, in Wissens-Ordnungen. Zu einer historischen Epistemologie 
der Literatur, hg. von Nicola Gess/Sandra Janßen, Berlin/Boston 2014, 145-179. 

7 Vgl. Klaus Weimar, „Text, Interpretation, Methode. Hermeneutische Klarungen‘, in Wie inter- 
national ist die Literaturwissenschaft? Methoden- und Theoriediskussion in den Literaturwissen- 
schaften: kulturelle Besonderheiten und interkultureller Austausch am Beispiel des Interpretations- 
problems (1950-1990), hg. von Lutz Danneberg/Friedrich Vollhardt, Stuttgart/Weimar 1996, 110-122. 
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Dies geschieht nach unseren bisherigen Erfahrungen, erstens, bei jenen The- 
menbereichen, die im literaturwissenschaftlichen Diskurs einen eher randständi- 
gen Status besitzen, bei Themen also, für die vermutlich wenig oder gar keine 
Trainingstexte dem Sprachmodell zugrunde liegen. Anzunehmen ist, dass dies auch 
für nicht, nur schwach kanonisierte oder dekanonisierte literarische Texte gilt. 
Folgen wir dieser Vermutung, dann stiege mit zunehmender Kanonizität die 
Wahrscheinlichkeit, dass die Ausgaben des Sprachmodells zumindest weitestge- 
hend korrekt sind, wenn es zum Beispiel um Handlungszusammenfassungen von 
literarischen Texten geht. Mit dieser Annahme steht dann wiederum die Frage im 
Raum, welche Parameter für die Kanonizität oder besser Relevanz bei der Bildung 
des Trainingstextkorpus relevant waren. Für die englischsprachige Literatur liegt 
inzwischen eine Studie vor, die anhand der Ausgaben von ChatGPT-4 rekonstruiert 
hat, welche literarischen Werke von diesem Modell memoriert® wurden, und damit, 
welche Werke sein implizites Wissen über Literatur prägen.” Es kam heraus, dass 
sowohl vor 1928 veröffentlichte, urheberrechtsfreie, als auch (urheberrechtlich 
geschützte) zeitgenössische Science Fiction- und Fantasy-Romane memoriert wur- 
den, wie zum Beispiel „Alice in Wonderland“, die Harry Potter-Romane, die „Lord of 
the Rings“-Trilogie, „The Hunger Games“ von Suzanne Collins oder „Pride and 
Prejudice“ von Jane Austen. Der Grad der Memorisierung hängt vermutlich, so die 
Autor:innen der Studie, mit der Häufigkeit zusammen, mit der Passagen aus diesen 
Werken im Internet erschienen sind. Der Fokus auf vor 1928 veröffentlichte, ka- 
nonisierte Texte und zeitgenössische Science Fiction- und Fantasy-Literatur hat in 
der Konsequenz zur Folge, dass das Sprachmodell zu Texten anderer Genres 
deutlich schlechtere Antworten generiert. Auch wenn eine vergleichbare Studie zur 
deutschsprachigen Literatur noch nicht vorliegt, muss dieser Bias immer mitge- 
dacht werden: Das Modell liefert bessere Aussagen über populäre Gegenwartstitel 
als über den Long Tail der Literatur. Weniger populäre Texte werden im Zweifelsfall 
mit wenig sinnvollen oder auch falschen Informationen beschrieben, die das Modell 
anhand der populären Titel generalisiert. Eine weitere Beobachtung erschwert das 
Zutrauen in die ChatGPT-Ausgaben zu literaturwissenschaftlichem Wissen. 


8 Zu beachten ist, dass das Memorieren im Kontext des maschinellen Lernens ein unerwünschter 
Effekt ist: Das Modell passt sich zu stark an den Trainingsdatensatz an und generalisiert in der 
Konsequenz schlechter in Bezug auf neue Daten. Das hier gemeinte Memorieren unterscheidet sich 
also von dem menschlichen Einprägen bzw. Memorieren. Vgl. Adrian de Wynter et al., „An Eva- 
luation on Large Language Model Outputs: Discourse and Memorization“, Natural Language Pro- 
cessing Journal, Bd. 4, 2023, in [https://doi.org/10.1016/j.nlp.2023.100024] (Zugriff: 06.10.2023). 

9 Kent K. Chang et al., „Speak, Memory: An Archaeology of Books Known to ChatGPT/GPT-4“, 2023, in 
[https://doi.org/10.48550/arXiv.2305.00118] (Zugriff: 18.08. 2023). 
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Der halluzinatorische Gehalt der Antworten scheint, zweitens, ebenso in jenen 
Bereichen groß, in denen die Fachterminologie nah der Alltagssprache ist oder die 
fachsprachlichen Termini in der Alltagssprache mit einer anderen Bedeutung 
verwendet werden. Auszüge aus einem Chat mit dem Sprachmodell zum Konzept 
der narrativen Ebenen vom 21. Februar 2023 verdeutlichen das: 


Prompt: Erläutere das Konzept der narrativen Ebenen oder Erzählebenen. 


ChatGPT: Das Konzept der narrativen Ebenen oder Erzählebenen bezieht sich auf die ver- 
schiedenen Ebenen oder Schichten einer Erzählung, die dazu beitragen, eine komplexe und 
tiefgründige Geschichte zu schaffen. Die Idee ist, dass eine Erzählung aus mehr als nur einer 
einfachen Handlung besteht, und dass es mehrere Ebenen gibt, auf denen eine Geschichte 
erzählt werden kann. 


Die erste Ebene einer Erzählung ist die Handlungsebene, auf der die grundlegende Geschichte 
erzählt wird. Das ist die Ebene, auf der die Charaktere handeln und die Ereignisse stattfinden. 
Es ist die Ebene, auf der die meisten Menschen eine Geschichte erleben und sie verstehen. 


Die zweite Ebene ist die Reflexionsebene. Hierbei handelt es sich um eine Ebene, die sich auf 
die Gedanken, Überlegungen und inneren Konflikte der Charaktere konzentriert. Diese Ebene 
gibt dem Leser Einblick in die Psyche der Charaktere und hilft dabei, ihre Entscheidungen und 
Handlungen zu verstehen. 


Die dritte Ebene ist die Metaebene. Hierbei handelt es sich um eine Ebene, auf der die Er- 
zählung selbst reflektiert und hinterfragt wird. Auf dieser Ebene kann die Erzählung selbst 
zum Thema werden, indem sie die Frage aufwirft, was es bedeutet, eine Geschichte zu erzählen 
und warum wir als Leser oder Zuschauer uns für sie interessieren. 


Das in der Narratologie einschlägige Konzept der narrativen Ebene bezieht sich auf 
Segmente einer Erzählung, die anhand von Sprecherwechseln oder in einigen Fäl- 
len auch von ontologischen Wechseln bestimmt werden. Neben Rahmen- und 
Binnenerzählungen, die jeweils eigene narrative Ebenen darstellen, ist jede Er- 
zählung innerhalb einer Erzählung potentiell eine narrative Ebene, sofern sie von 
einer anderen Erzählinstanz (typischerweise einer Figur der Erzählung) hervor- 
gebracht wird, ebenso wie jene Teile der Erzählung narrative Ebenen darstellen, 
welche sich durch einen Wechsel der fiktionalen Welt von anderen Teilen der Er- 
zählung unterscheiden. Wenn zum Beispiel in einer Erzählung eine Figur selbst 
eine Erzählung eröffnet, einer anderen Figur also etwas erzählt, dann wird diese 
Erzählung in der Erzählung als eine zweite Ebene betrachtet. Auf der zweiten Ebene 
kann erneut durch eine weitere Figur eine Erzählung stattfinden und damit eine 
dritte Ebene entstehen, die somit zweifach eingebettet ist. Mit anderen Worten: 


10 Matias Martinez/Michael Scheffel, Einführung in die Erzähltheorie, München 12020, 79ff.; zum 
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Die erste Ebene ist auf keinen Fall eine Handlungs-, die zweite keine Reflexions- 
ebene. Die Antwort von ChatGPT kontaminiert das narratologische Konzept mit 
anderen, eher dem Alltagswissen entstammenden Kriterien zur Benennung von 
Ebenen. Mit der vom Chatbot als „Metaebene“ ausgegebenen dritten Ebene wird 
hingegen durchaus ein Terminus bemüht, der dem der Metadiegesis aus dem Be- 
griffsrepertoire der Narratologie im Bereich der narrativen Ebenen ähnelt. Nur 
bezeichnet dieser wiederum einen eigenständigen Erzählakt auf der zweiten Ebene. 
Es gibt in den Ausgaben des Chatbots folglich Anklänge von Expertise und es gibt 
diverse Halluzinationen beziehungsweise Falschaussagen, die mit schwadronie- 
renden Ausführungen verknüpft werden, zum Beispiel wenn von einer „komple- 
xe[n] und tiefgründige[n] Geschichte“ die Rede ist. 

Problematisch ist die Verwendung des Chatbots für die Bereitstellung litera- 
turwissenschaftlichen Wissens also in mehrfacher Hinsicht. Neben dem halluzi- 
natorischen Gehalt und der Kontamination der Fachterminologie mit alltags- 
sprachlichen Vorstellungen erweist sich das Black-Box-Problem, die epistemische 
Opazität des Programms, als schwierig für die wissenschaftliche Praxis. Zunächst 
kann nur näherungsweise und mit großen Mühen ermittelt werden, auf welchen 
Texten beziehungsweise Quellen die modellgenerierten Texte basieren. Denn 
OpenAI, aber auch andere kommerzielle Anbieter großer Sprachmodelle nehmen 
keine detaillierte Offenlegung der verwendeten Trainingsdaten vor. In der oben 
bereits erwähnten Studie zum englischsprachigen ChatGPT-Korpus wurde dessen 
literarisches Wissen letzten Endes ausschließlich anhand der Auslasstexte des 
Modells, also über den Output, rekonstruiert. Außerdem benötigen die LLMs sehr 
große Mengen an Trainingsdaten. Diese werden häufig unkuratiert aus dem In- 
ternet (Seiten wie Reddit oder Wikipedia) entnommen und enthalten dementspre- 
chend alle möglichen Probleme des Internets, von Verschwörungstheorien über 
Hassrede bis hin zu falschen Informationen. Diese werden, sofern sie in größerem 
Umfang im Korpus enthalten sind, vom Modell als erwünscht gelernt und ent- 
sprechend im Output reproduziert. Neben dem Problem des für die Nutzer:innen 
unkenntlichen Quellenmaterials kommt hinzu, dass die Algorithmen und Modelle, 
die aus einem Input den entsprechenden Output erzeugen, ebenfalls nicht trans- 
parent sind, das heißt es sind nicht nur das Quellenmaterial, sondern auch die 
Prozesse der Verarbeitung nicht nachvollziehbar. Während das Trainingsmaterial 
im Prinzip einfach offengelegt und damit transparent gemacht werden könnte, lässt 
sich die Frage der Verarbeitungsprozesse hingegen nicht so leicht lösen, da diese 
aufgrund der algorithmischen Struktur von Deep Learning per se nicht für Men- 


Konzept des illokutionären und ontologischen Ebenenwechsels: vgl. Marie-Laure Ryan, Possible 
Worlds, Artificial Intelligence, and Narrative Theory, Bloomington 1991, 175-177. 
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schen nachvollziehbar sind.'' KI-Modelle liefern also nur Ergebnisse, aber keine 
anhand des Verarbeitungsweges nachvollziehbaren Rechtfertigungen für diese 
Ergebnisse; zum anderen ist nicht ersichtlich, was aus welchen Trainingsdaten 
gelernt wurde. 

Wenn, wie soeben dargelegt, die Bereitstellung literaturwissenschaftlicher 
Erkenntnisse und Wissensbestände durch Sprachmodelle problembehaftet ist, so 
steht zur Diskussion, wie ChatGPT und Co. auf andere Weise produktiv mit dieser 
Disziplin zusammengeführt werden können. In einer Metastudie von Caleb Ziems 
et al. vom April 2023 wurden 13 Sprachmodelle und ihr Nutzen für die Sozialwis- 
senschaften untersucht, hierbei wurden explizit auch text- beziehungsweise lite- 
raturwissenschaftliche Forschungsfragen berücksichtigt.'” Die Forscher:innen 
kommen zu dem Schluss, dass zum Beispiel ChatGPT gut für diverse Zero-Shot- 
Klassifikationsaufgaben, also Klassifikationsleistungen ohne vorheriges Einlesen 
von Trainingsdaten, geeignet ist. Beispielhaft führen sie die Erkennung von Ein- 
stellungen beziehungsweise Meinungen in eingegebenen Texten an. Welche Mei- 
nung nimmt beispielsweise ein bestimmter Text gegenüber Atheismus oder der 
Legalisierung der Abtreibung ein? Ebenso gut schneiden die LLMs bei der Erken- 
nung von Fehlinformationen oder Emotionen ab, was die Autor:innen der Studie 
darauf zurückführen, dass es für jede dieser Aufgaben entweder eine objektive, 
evidenzbasierte Grundlage gibt (wie im Fall von Fake News) oder ein an um- 
gangssprachlichen Definitionen ausgerichtetes Schema. Der damit aufgerufene 
Anwendungsbereich erscheint insbesondere für die computationelle Literaturwis- 
senschaft’? interessant, in welcher manuelle wie automatisierte Annotationsauf- 
gaben von zentraler Bedeutung sind. Einschränkend ist jedoch zu berücksichtigen, 
dass laut der erwähnten Studie die Sprachmodelle bei komplexeren Taxonomien 
schlechter abschneiden, also bei Aufgaben, bei denen die Annotationsrichtlinien 
durch Expertenwissen geprägt sind. Der Einsatz von Sprachmodellen im For- 
schungskontext bietet sich also lediglich bei kleineren, einfach strukturierten An- 


11 Inzwischen wird dazu unter den Schlagwörtern der Interpretable AI bzw. Whiteboxing ge- 
forscht. Vgl. u.a. Ajay Thampi, Interpretable AI. Building Explainable Machine Learning Systems, New 
York 2022. 

12 Caleb Ziems et al., „Can Large Language Models Transform Computational Social Science?“, 2023, 
in [https:/doi.org/10.48550/arXiv.2305.03514] (Zugriff: 18.08.2023). 

13 Die computationelle bzw. computergestützte Literaturwissenschaft (computational literary 
studies, CLS) ist ein interdisziplinäres Teilgebiet der Digital Humanities, welches Methoden aus der 
Informatik resp. des Natural Language Processing (NLP), der computationellen Linguistik und der 
Literaturwissenschaft für die Analyse literarischer Texte bzw. Korpora vereint. Im deutschspra- 
chigen Bereich erhielt dieses Forschungsfeld eine größere Aufmerksamkeit durch das von der 
Deutschen Forschungsgemeinschaft (DFG) seit dem Jahr 2020 geförderte Schwerpunktprogramm 
SPP 2207 „Computational Literary Studies“. 
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notationsaufgaben an, für welche keine Trainingsdaten mehr generiert werden 
müssen. Die Frage nach dem Nutzen der LLMs für die literaturwissenschaftliche 
Fachexpertise und Praxis bleibt dennoch prekär - wenn sie nicht von einer anderen 
Perspektive her angegangen wird. In einer solchen Perspektive können in der li- 
teraturwissenschaftlichen Praxis und Lehre die soeben genannten Defizite wie 
Fehler in den ChatGPT-Texten produktiv genutzt werden, quasi wie bei einem so- 
kratischen Gespräch oder eben im Sinn von Kleists Überlegungen bezüglich der 
Ideenfindung beim Reden. 


2 ChatGPT in der literaturwissenschaftlichen 
Lehre 


Um die Vorzüge von ChatGPT in der literaturwissenschaftlichen Lehre zu ver- 
deutlichen, sollen Beispiele herangezogen werden, die von uns für Lehrveranstal- 
tungen an der TU Darmstadt konzipiert wurden. Grundsätzliches Ziel bei der Ver- 
wendung des Sprachmodells in der Lehre ist es dabei, den Studierenden nicht allein 
Kompetenzen im Umgang mit KI-Textgeneratoren zu vermitteln, sondern ebenso 
ihre literaturwissenschaftliche Expertise zu stärken.'* Der bereits erwähnte Chat, 
in welchem das Sprachmodell nach den narrativen Ebenen befragt wurde, ließe 
sich im Seminar demnach mit der Aufgabe an die Studierenden präsentieren, jene 
Stellen im ChatGPT-Text zu identifizieren, die entweder falsch, teilweise richtig oder 
ungenau sind. Auf diese Weise kann einerseits das erzähltheoretisch richtige Ver- 
ständnis von Erzählebenen mobilisiert werden, andererseits können die Studie- 
renden im Fortgang durch verbesserte, reaktive Prompts versuchen, den Chatbot 
einen erzähltheoretisch fundierten Beispieltext mit drei Erzählebenen generieren 
zu lassen, wobei dieses Prompt Engineering im Seminar ebenfalls reflektiert werden 
soll. Ein weiteres Beispiel zielt in eine ähnliche Richtung und betrifft das Konzept 
der Handlung beziehungsweise des Plots von Erzählungen. Die Studierenden wer- 
den gebeten, eine Handlungszusammenfassung von Kleists „Das Erdbeben von 
Chili“ zu verfassen. Verbunden ist diese Aufgabe lediglich mit der Auflage, hierfür 
nicht mehr als 20 Hauptsätze zu verwenden und für jeden neuen Satz einen Zei- 
lenwechsel vorzunehmen. Die Zusammenfassungen der Studierenden werden dann 
mit jener des Sprachmodells verglichen. 


14 Vgl. Henner Gimpel et al., „Unlocking the Power of Generative AI Models and Systems such as 
GPT-4 and ChatGPT for Higher Education: A Guide for Students and Lecturers. Discussion Paper“, 
2023, in [https://tip.de/kana7] (Zugriff: 24.10.2023). 
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Prompt: Schreibe eine möglichst einfache Zusammenfassung der Erzählung „Das Erdbeben in 
Chili“ von Heinrich von Kleist in 20 Sätzen, möglichst als Hauptsätze ohne Nebensätze. Fasse 
dabei die wichtigsten Geschehnisse des Textes zusammen. 


ChatGPT: 

1. „Das Erdbeben in Chile“ ist eine Erzählung von Heinrich von Kleist. 

2. Es geht um ein verheerendes Erdbeben in Santiago de Chile. 

3. Viele Menschen sterben bei dem Beben. 

4. Die Protagonisten Jeronimo und Dofia Blanca sind ein Paar und werden durch das Beben 
getrennt. 

5. Sie suchen verzweifelt nach einander. 

6. Sie erleben viele Abenteuer, während sie nach einander suchen. 

7. Sie finden sich schließlich wieder. 

8. Sie beschließen zusammen zu fliehen, um dem Chaos zu entkommen. 

9. Sie begegnen vielen anderen Menschen, die das gleiche Schicksal erlitten haben. 
10. Sie versuchen, ihr Leben wieder aufzubauen. 

11. Sie beschließen, sich in einer anderen Stadt niederzulassen. 

12. Sie beginnen ein neues Leben zusammen. 

13. Das Erdbeben hat ihr Leben verändert. 

14. Sie müssen alles von vorne aufbauen. 

15. Sie finden jedoch Trost in ihrer Liebe zueinander. 

16. Sie beschließen, ihr Leben gemeinsam weiterzuführen. 

17. Sie sind bereit für die Zukunft. 

18. Die Erzählung endet damit, dass das Paar ein neues Leben beginnt. 


Auch hier, bei einem in der Germanistik kanonischen Text, finden sich diverse 
Ungenauigkeiten und Halluzinationen. Dies beginnt mit den Figuren - eine Dona 
Blanca gibt es in Kleists Text überhaupt nicht; die Liebesbeziehung besteht zwi- 
schen Jeronimo und Josephe, die von ChatGPT überhaupt nicht erwähnt wird. Auch 
werden die Protagonist:innen nicht erst durch das Erdbeben getrennt, sondern 
durch ihre Inhaftierung in Folge ihrer vom Vater von Josephe nicht gebilligten 
Verbindung. Frappierend ist, dass ChatGPT der Erzählung ein positives Ende zu- 
schreibt. Im eigentlichen Kleist-Text wird das Paar in einem Tumult vor einer Kirche 
brutal ermordet, während sie bei ChatGPT am Ende, nachdem sie mehrere Aben- 
teuer überstanden haben, ein neues Leben beginnen. 

Im Seminar kann nun das Wissen der Studierenden über den Text mit dem der 
ChatGPT-Ausgabe kontrastiert und die Relevanz der einzelnen Handlungsab- 
schnitte, Figuren und Ereignisse für das Handlungsgerüst sowie die Strukturierung 
des Textes diskutiert werden. Was fehlt in den Zusammenfassungen von ChatGPT 
und in ausgewählten Texten von den Studierenden? In einem zweiten Schritt, 
verbunden mit der Relevanzfrage, können dann das literaturwissenschaftliche 
Konzept der Handlung wie die Methodik bei der Erstellung von Handlungszusam- 
menfassungen reflektiert, diskutiert und evaluiert werden. Überprüft und gefördert 
wird dergestalt die Fachexpertise, ein wissenschaftlich gestütztes Handlungskon- 
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zept zu haben, es definieren, erläutern und anwenden zu können. Allerdings kön- 
nen literaturwissenschaftliche Konzepte mit einem Sprachmodell im Seminar nicht 
nur eingeübt, sondern auch problematisiert werden. Möglich wäre zum Beispiel, 
den Begriff der Epoche zu problematisieren und ChatGPT nach einer begründeten 
Epochenzuordnung von einzelnen Textauszügen zu fragen, ohne den Autor:in- 
nennamen anzugeben. Wenn die erste und zweite Strophe eines Gedichts von No- 
valis dann — wie geschehen — dem jungen Schiller der Sturm-und-Drang-Zeit zu- 
gewiesen wird, können im Seminar die Konvergenz von ästhetischen Programmen, 
aber auch die in ihrer schematischen Orientierungsfunktion nicht selten prekären 
Epochenkonstruktionen in der Literaturwissenschaft thematisiert werden. 

Die offensive Integration von textgenerativer Software in die literaturwissen- 
schaftliche Lehre eröffnet also viele Möglichkeiten. Mit ihr können die rezeptiven 
wie produktiven Textumgangsformen der Studierenden, ihre Fachexpertise und ihr 
kritischer Umgang mit Forschungspositionen und -routinen gefördert werden. 
Fachunabhängiges, übergreifendes Ziel wäre dabei zugleich, die Mündigkeit im 
Umgang mit großen Sprachmodellen zu befördern und Kompetenzen im Bereich 
Prompt Engineering zu vermitteln, also Wege aufzuzeigen, wie Prompts gestaltet 
und verfeinert werden können, um bestmöglichen Output zu erzeugen. 


3 Fazit: Von der Output- zur Input-Optimierung 


Dem Vorbild der dialogischen Kommunikation folgend, können die Übungen mit 
den Studierenden zum Prompt Design auch bewusst tentativ angelegt sein. Das 
Sprachmodell figuriert dann als Gesprächspartner im Kleistschen Sinn, dessen 
Äußerungen als Artikulation eines kollektiven Wissens im Wechselspiel von In- und 
Output, in der Abfolge von Frage, Antwort und Nachfrage hilft, den Prompt weniger 
in seiner Form zu verbessern als in seinem Inhalt zu verändern. Kleists eingangs 
zitiertes Essay auf die KI-Textgeneratoren zu übertragen, bedeutet demnach, nicht 
auf die Output-, sondern die Input-Optimierung zu orientieren. Oder, mit Kleists 
Worten: 


Aber weil ich doch irgendeine dunkle Vorstellung habe, die mit dem, was ich suche, von fern 
her in einiger Verbindung steht, so prägt, wenn ich nur dreist damit den Anfang mache, das 
Gemüt, während die Rede fortschreitet, in der Notwendigkeit, dem Anfang nun auch ein Ende 
zu finden, jene verworrene Vorstellung zur völligen Deutlichkeit aus, dergestalt, daß die Er- 
kenntnis zu meinem Erstaunen mit der Periode fertig ist. Ich mische unartikulierte Töne ein, 
ziehe die Verbindungswörter in die Länge, gebrauche wohl eine Apposition, wo sie nicht nötig 
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wäre, und bediene mich anderer, die Rede ausdehnender, Kunstgriffe, zur Fabrikation meiner 
Idee auf der Werkstätte der Vernunft, die gehörige Zeit zu gewinnen."® 


Im Gespräch probiert sich der Redner, tastet sich mit Kunstgriffen nach vorn, mit 
Vorstellungen, die nur von fern her mit dem noch nicht fest definierten Ziel in 
Verbindung stehen und die an Deutlichkeit erst im Gespräch gewinnen. Die Pro- 
blemlösung obliegt nicht dem Gesprächspartner, dessen Antworten oder Reaktio- 
nen daher auch nicht der Präzision bedürfen. Was Kleist hier beschreibt, kann 
durchaus mit dem konnektionistischen Verfahren der LLMs gleichgesetzt werden, 
bei welchem Wissensbestandteile nach ihrem wahrscheinlichen Näheverhältnis 
zusammengefügt werden. Der Kompetenzüberschuss aber liegt immer bei den 
Nutzer:innen des Sprachmodells, die für die „Fabrikation der Idee“ im Gespräch, im 
Chat mit dem Sprachmodell ihre ungefähren Vorstellungen überprüfen, anpassen 
und bestenfalls präzisieren. Geraten sie dabei in eine Sackgasse, sollten sie sich 
einen neuen Gesprächspartner suchen, also einen neuen Chat beginnen, denn das 
Programm merkt sich nur den Verlauf der aktuellen Unterhaltung und kann sich im 
nächsten Chat nicht wieder drauf beziehen. 

Zusammenfassend lässt sich festhalten, dass es sich bei Chatbots trotz ihrer 
elaborierten sprachlichen Form nicht um Expertensysteme beziehungsweise Ex- 
perten handelt. Vielmehr sind sie als sehr mächtige, aber opake statistische Werk- 
zeuge anzusehen, deren Integration in die literaturwissenschaftliche Praxis auf 
vielfältige Weise sinnvoll sein kann. Während der Output neue und interessante 
Beobachtungen enthalten kann, ist dessen kritische Beurteilung und unabhängige 
Überprüfung nach den Standards der Disziplin nötig. Die Sprachmodelle können 
somit als akademischer Sparringspartner in der Lehre eingesetzt werden und das 
hochschuldidaktische Instrumentarium erweitern. Sie können in der Forschung 
eine Assistenzfunktion übernehmen, zum Beispiel für Zero-Shot-Klassifikations- 
aufgaben, und sie können ebenso eine ko-kreative Funktion bei der Entwicklung 
von Forschungsfragen oder der Überprüfung von Forschungsergebnissen bezüglich 
ihrer Plausibilität wahrnehmen. Diese Ko-Kreativität konstituiert dabei einen Re- 
sonanz- und Reflexionsraum und führt also nicht zu einer Veräußerung der ei- 
gentlichen wissenschaftlichen Tätigkeit. 

Für die Geisteswissenschaften im Allgemeinen und die Literaturwissenschaft 
im Besonderen stellen die KI-Textgeneratoren, insofern ihre Anwendung kritisch, 
reflektiert erfolgt, keine Gefährdung der akademischen Integrität dar. In Bezug auf 
die Hochschullehre wurde in den letzten Monaten hingegen mehrfach die Be- 
fürchtung geäußert, dass Studierende ihre Fähigkeiten zur Recherche, zum kriti- 


15 Kleist 1990, 535. 
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schen Denken und zur schriftlichen Kommunikation verlernen könnten. Richtig ist, 
dass die Assistenzfunktion von Sprachmodellen Plagiate oder Urheberrechtsver- 
letzungen erleichtert und vor allem, je nach Einsatz der KI-Textgeneratoren, die 
geforderte Eigenständigkeit wissenschaftlichen Arbeitens unterlaufen kann. Wis- 
senschaftliches Fehlverhalten aber hat es auch davor gegeben. Wichtig ist, den 
Studierenden den kritischen Umgang mit den generierten Texten und die sinnvolle 
Verwendung der KI-Tools aufzuzeigen. Ihre offensive Einbeziehung in die Hoch- 
schullehre erscheint uns daher nicht nur wünschenswert, sondern geboten. Nicht 
zu vergessen ist darüber hinaus, dass der weit vorangeschrittene digitale Trans- 
formationsprozess bereits unser Verständnis von Kommunikation und Text ver- 
ändert hat. Der Umgang mit KI-generierten Texten und Bildern wird somit eine 
Schlüsselkompetenz der nahen Zukunft sein und die Literaturwissenschaft als ge- 
sellschaftlichen Ort, an dem zu Texten, Textformen und deren Rezeption geforscht 
wird, in besonderer Weise fordern. Die „Algorithmisierung der Kultur“ (Gerhard 
Lauer) verlangt nach philologischer Kompetenz respektive Expertise. Eine Litera- 
turwissenschaft, die sich dieser Herausforderung stellt, braucht sich um ihre ge- 
sellschaftliche Legitimation nicht zu sorgen. 


Ann-Katrin van den Ham 
KI-Textgeneratoren: Eine neue Ara des 
Unterrichts? 


Perspektiven und Gefahren 


Abstract: This paper provides an analysis of the role of AI text generators like 
ChatGPT in educational settings, focusing on both the potential benefits and chall- 
enges. It begins by introducing the didactic triangle model to analyze traditional 
teacher-student-content interactions and how this model is extended to a tetrahe- 
dron model including digital technologies. The text then reviews existing literature 
on the role of Alin education, exploring the performance, roles, and capabilities of 
AI text generators in educational contexts. These studies highlight the transforma- 
tive potential of AI technologies in reshaping the role of teachers, who are seen as 
mediators and collaborators rather than mere information providers. The paper 
concludes that while AI text generators offer promising avenues for personalized 
and efficient learning, they also raise ethical and practical concerns that need to be 
addressed, like data privacy, the risk of misinformation, and the need for teachers to 
acquire new skills to effectively integrate AI into their teaching practices. The paper 
suggests that traditional didactic models may need to be revised to account for the 
complexities introduced by AI technologies, including their autonomous and ad- 
aptive nature. The paper calls for a multi-dimensional approach that considers 
pedagogical, ethical, and organizational aspects of education in the age of AI. 


1 Einleitung 


Die Entwicklung und Verbreitung von KI-Textgeneratoren wirft neue Fragen be- 
züglich ihres Potenzials für den Bildungssektor auf. Einerseits bieten KI-Textgene- 
ratoren die Möglichkeit, den Schulunterricht durch automatische Generierung von 
Unterrichtsmaterial zu bereichern und zu optimieren. Andererseits müssen jedoch 
datenschutzrechtliche Bedenken und ethische Fragen im Umgang mit KI im Bil- 
dungsbereich sorgfältig berücksichtigt werden. Es ist unerlässlich, diese Probleme 
zu lösen, bevor KI-gestütztes Unterrichten und Lernen erfolgreich in den Unterricht 
integriert werden kann. Studien zeigen, dass trotz des Potenzials von KI im Bil- 


8 Open Access. © 2024 bei den Autorinnen und Autoren, publiziert von De Gruyter. Dieses Werk ist 
lizenziert unter einer Creative Commons Namensnennung - Nicht kommerziell - Keine Bearbeitung 4.0 International 
Lizenz. https:/doi.org/10.1515/9783111351490-030 
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dungsbereich noch wenig Forschung zur Rolle von KI-Textgeneratoren und Ak 
zeptanz durch die Schülerinnen und Schüler existiert." 

In diesem Beitrag wird die potenzielle Bedeutung von KI-Textgeneratoren für 
Unterrichtsprozesse betrachtet und wie sich dies auf die Rolle der Lehrkräfte im 
Unterricht auswirkt. Dabei werden sowohl die Perspektiven als auch Herausfor- 
derungen für die Nutzung von KI-Textgeneratoren im Unterricht betrachtet. Es wird 
diskutiert, welche Vorteile KI-Textgeneratoren bieten können, wie zum Beispiel die 
automatische Generierung von Unterrichtsmaterialien, die Anpassungsfähigkeit an 
individuelle Lernbedürfnisse und die Möglichkeit der effektiven Rückmeldungen an 
Schülerinnen und Schüler. Darüber hinaus werden potenzielle Gefahren und Her- 
ausforderungen angesprochen, die sich aus der Nutzung von KI-Textgeneratoren 
ergeben können. Um eine Grundlage für diese Betrachtungen zu schaffen, wird 
zunächst ein Modell zur Analyse traditioneller Interaktionen im Unterricht prä- 
sentiert. 


2 Modell zur Analyse traditioneller Interaktionen 
im Unterricht 


Das didaktische Dreieck aus Lehrenden, Lernenden und Inhalten ist ein bekanntes 
Konzept im Bildungskontext. Es beschreibt die dynamische Wechselbeziehung 
zwischen Lehrenden, Lernenden und den zu vermittelnden Inhalten.” Es gibt ver- 
schiedene Varianten des didaktischen Dreiecks, sowohl in der Darstellungsweise als 
auch in den Bezeichnungen. Diese Varianten spiegeln unterschiedliche Perspekti- 
ven und Verwendungsweisen wider. Das didaktische Dreieck setzt sich aus den 
folgenden Elementen zusammen: 

Die/Der Lehrende: Dies ist die Person, die den Lernprozess initiiert und leitet. 
Die/Der Lehrende ist für die Vermittlung von Wissen, Fertigkeiten und Kompe- 
tenzen an die Lernenden sowie für die Planung und Organisation des Unterrichts 
verantwortlich. 

Die/Der Lernende: Dies ist die Person, die aktiv am Lernprozess teilnimmt. Die/ 
Der Lernende erwirbt, verarbeitet und verinnerlicht aktiv Wissen und Kompeten- 
zen. 


1 André Renz, „KI in der Bildung: Educational technology und KI“, in Arbeitswelt und KI 2030. 
Herausforderungen und Strategien für die Arbeit von morgen, hg. von Inka Knappertsbusch/Kai 
Gondlach, Wiesbaden 2021, 381-388. 

2 Astrid Baltruschat, Didaktische Unterrichtsforschung, Wiesbaden 2018, 39-84. 
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Der Lehrinhalt: Das sind die Kenntnisse, Informationen, Kompetenzen oder 
Fähigkeiten, die während des Lernprozesses vermittelt werden sollen. Die Inhalte 
können verschiedene Gebiete betreffen, beispielsweise mathematische Konzepte, 
historische Ereignisse, Sprachkenntnisse oder praktische Fähigkeiten. 

Das Verhältnis zwischen diesen drei Komponenten des didaktischen Dreiecks 
ist dynamisch und wechselseitig. Das didaktische Dreieck macht deutlich, dass der 
Erfolg einer Lernsituation von der Interaktion zwischen dem Lehrenden, dem 
Lernenden und dem zu vermittelnden Inhalt abhängt. Da in Bezug auf den Unter- 
richtsgegenstand ein Gefälle besteht, ist die Beziehung asymmetrisch. Erst dann 
kann eine der Personen die Lehrendenrolle übernehmen und das Thema so auf- 
bereiten, dass die andere Person daran anschließen kann. In der Schule finden die 
Interaktionen in diesem Dreieck in der Regel im Rahmen des Unterrichtsgesche- 
hens statt und sind daher zeitlich begrenzt. Das Unterrichtsgeschehen kann auch 
die zeitliche Angemessenheit der Interaktion einschränken. So ist es zum Beispiel 
nicht immer möglich, unmittelbar im Anschluss an die Bearbeitung einer Aufgabe 
ein Feedback zu geben.* 

Eine Weiterentwicklung des didaktischen Dreiecks um eine vierte Komponente 
stellt das didaktische Tetraeder dar.” Olive et al. haben das didaktische Dreieck um 
die Dimension der digitalen Technologie erweitert.” Bei Prediger et al. sind es 
Materialien und Medien, die das Didaktische Dreieck erweitern.® Die vierte Kom- 
ponente betrifft die materiellen oder immateriellen Ressourcen, die im Lernprozess 
eingesetzt werden. Dabei kann es sich beispielsweise um Bücher, Unterrichtsma- 
terialien, multimediale Geräte oder auch digitale Lernplattformen handeln. Das 
didaktische Tetraeder ermöglicht durch die Fokussierung auf die Rolle von Arte- 


3 Baltruschat 2018, 39-84. 

4 Susanne Prediger et al., „Drei-Tetraeder-Modell der gegenstandsbezogenen Professionalisie- 
rungsforschung: Fachspezifische Verknüpfung von Design und Forschung“, Jahrbuch für Allgemeine 
Didaktik, hg. von Klaus Zierer, Bielefeld 2017, 159-177. 

5 Joana Duarte et al., „Sprachlich bedingte Schwierigkeiten von mehrsprachigen Schülerinnen und 
Schülern bei Textaufgaben“, in Mathematiklernen unter Bedingungen der Mehrsprachigkeit. Stand 
und Perspektiven der Forschung und Entwicklung in Deutschland, hg. von Susanne Prediger/Erkan 
Ozdil, Münster 2011, 35-53. 

6 Jürgen Roth, „Digitale Werkzeuge im Mathematikunterricht - Konzepte, empirische Ergebnisse 
und Desiderate“, in Vielfältige Zugänge zum Mathematikunterricht: Konzepte und Beispiele aus 
Forschung und Praxis, hg. von Andreas Büchter et al., Wiesbaden 2019, 233-248. 

7 John Olive et al., „Mathematical Knowledge and Practices Resulting from Access to Digital Tech- 
nologies“, in Mathematics Education and Technology-Rethinking the Terrain. The 17th ICMI Study, hg. 
von Celia Hoyles/Jean-Baptiste Lagrange, New York et al. 2010, 133-177. 

8 Prediger et al. 2017, 159-177. 
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fakten in der Unterrichtsgestaltung eine ganzheitlichere Betrachtung von Lehr- und 
Lernprozessen.” 

Neben dem Beziehungsdreieck des didaktischen Dreiecks enthält das Tetraeder 
drei weitere Beziehungsdreiecke. Mit dem Dreieck zwischen Lehrperson, Inhalt 
und (digitalen) Technologien wird der Prozess beschrieben, in dem sich die Lehr- 
person selbst mit dem Inhalt auseinandersetzt und versucht, die damit verbunde- 
nen Probleme mit Hilfe von (digitalen) Technologien zu lösen beziehungsweise den 
Inhalt im Zusammenspiel mit (digitalen) Technologien zu erarbeiten und ver- 
ständlich zu machen. Zum anderen geht es darum, dass die Lehrperson überlegt, 
wie der Inhalt mit Hilfe der (digitalen) Technologie gut dargestellt und erfasst 
werden kann und auf dieser Basis eine Lernumgebung zum Inhalt unter Einbe- 
ziehung der (digitalen) Technologie konzipiert. Ein anderes Dreieck des didakti- 
schen Tetraeders bezieht sich auf die Lern- und Problemlösungsprozesse der 
Schülerinnen und Schüler, die versuchen, Inhalte mit Hilfe von (digitalen) Tech- 
nologien zu durchdringen und zu verstehen sowie Probleme zu lösen. Die Inter- 
aktion zwischen der Lehrperson, den Schülerinnen und Schülern und den (digita- 
len) Technologien bildet die letzte Fläche des didaktischen Tetraeders. Aus der Sicht 
der Lehrperson stellt sich die Frage, wie die Lernenden dabei unterstützt werden 
können, die (digitalen) Hilfsmittel als persönliches Instrument zu nutzen. Dies kann 
beispielsweise durch die explizite Thematisierung von Nutzungs-, Problemlöse- und 
Reflexionsstrategien für die Arbeit mit (digitalen) Technologien geschehen. Darüber 
hinaus geht es um die Kommunikation, bei der die (digitale) Technologie zwischen 
den Schülerinnen und Schülern und der Lehrkraft als Medium verwendet wird.'% 

Aber kann das didaktische Tetraeder auch beschreiben, wie KI-Textgeneratoren 
wie ChatGPT als digitale Technologie im Unterricht mit den anderen Komponenten 
interagieren? Eine Beantwortung dieser Frage erfordert zunächst eine Bestands- 
aufnahme von Erkenntnissen bezüglich der Rolle von KI-Technologie im Unterricht. 


3 Erkenntnisse zur Rolle von KI im Unterricht 


WissenschaftlerInnen haben der Zusammenarbeit zwischen Mensch und KI im 
Zuge der jüngsten Verbreitung von KI im Klassenzimmer große Aufmerksamkeit 
geschenkt. Sie gehen davon aus, dass Menschen und KI zusammen effektiver lernen 


9 Roth 2019, 233-248. 

10 Bärbel Barzel/Jürgen Roth, „Bedienen, Lösen, Reflektieren - Strategien beim Arbeiten mit di- 
gitalen Werkzeugen“, Mathematik Lehren, Bd. 211, 2018, 16-19. 

11 Roth 2019, 233. 
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können als Menschen oder KI allein.’” In dieser Forschungsrichtung wird die ver- 
mittelnde Rolle der Lehrkräfte hervorgehoben, anstatt KI als potenziellen Ersatz für 
Lehrkräfte zu betrachten.** Holstein et al. haben einen konzeptionellen Rahmen für 
die hybride Adaptivität von Mensch und KI in der Bildung eingeführt, der ver- 
schiedene Möglichkeiten aufzeigt, wie sich KI-Technologie und menschliche Ver- 
mittlerInnen gegenseitig ergänzen können.'* Dabei werden folgende Funktionen 
beschrieben: „Goal Augmentation“ (gegenseitige Unterstützung durch Beeinflus- 
sung der Ziele des jeweils anderen), „Perceptual Augmentation“ (Verbesserung der 
gegenseitigen Fähigkeiten zur Wahrnehmung von unterrichtsrelevanten Informa- 
tionen oder Handlungsmöglichkeiten), „Action Augmentation“ (Stärkung und Er- 
weiterung der Möglichkeiten, Fähigkeiten und Kapazitäten zum instruktionalen 
Handeln des jeweils anderen), and „Decision Augmentation“ (gegenseitige Hilfe für 
das Treffen von effektiveren pädagogische Entscheidungen). In diesem theoreti- 
schen Rahmen für die Zusammenarbeit zwischen Lehrkräften und KI unterstrichen 
sie die bedeutende Rolle der Lehrkraft bei der Maximierung der Wirksamkeit von 
KI." Zusätzlich zu diesen theoretischen Untersuchungen haben einige, wenn auch 
begrenzte, empirische Forschungen gezeigt, wie menschliche Lehrkräfte KI-Tech- 
nologien tatsächlich ergänzen können. Frühere Studien haben sich dabei in erster 
Linie auf Werkzeuge konzentriert, die auf bestimmte Ziele in einer bestimmten 
Unterrichtsphase abzielen, wie zum Beispiel in den Fällen von Smart Glasses und 
einer Storytelling-App.'*'’ Dies deutet darauf hin, dass in den meisten Studien die 
Untersuchung von KI-Technologien auf bestimmte Rollen innerhalb dieser vier 
Anwendungsbereiche beschränkt war.'? Auch in der Literatur, die sich mit der Rolle 
von Chatbots im Bildungsbereich beschäftigt, ist der oben beschriebene Trend zu 
beobachten. So führten Kuhail et al. ein systematisches Review von 36 Artikeln 
durch, um die Versuche, Chatbots in der Bildung einzusetzen, zu verstehen, zu 


12 Kenneth Holstein et al., „A Conceptual Framework for Human-Al Hybrid Adaptivity in Educa- 
tion“, Artificial Intelligence in Education, 2020, 240-254. 

13 Jaeho Jeon/Seongyong Lee, „Large language models in education: A focus on the complementary 
relationship between human teachers and ChatGPT“, Education and Information Technologies, 2023, 
1-20. 

14 Holstein et al. 2020, 240-234. 

15 Ebd. 

16 Kenneth Holstein et al., „Student Learning Benefits of a Mixed-Reality Teacher Awareness Tool in 
AI-Enhanced Classrooms‘, Artificial Intelligence in Education, 2018, 154-168. 

17 Zheng Zhang et al., „StoryBuddy: A Human-Al Collaborative Chatbot for Parent-Child Interactive 
Storytelling with Flexible Parental Involvement“, in Proceedings of the 2022 CHI Conference on 
Human Factors in Computing Systems, hg. von Simone Barbosa et al., 2022, 1-21. 

18 Jeon/Lee 2023, 1-20. 
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vergleichen und zu reflektieren." Sie fanden in ihrer Übersichtsarbeit heraus, dass 
den Chatbot-Anwendungen in den Studien meist eine von vier verschiedenen Rollen 
zugeschrieben wurden: „Teaching Agents“ übernehmen die Rolle menschlicher 
Lehrkräfte und können Anweisungen geben, Beispiele veranschaulichen, Fragen 
stellen und sofortiges Feedback geben. Auf der anderen Seite dienen „Peer-Agents“ 
als Lernpartner für Lernende, um Peer-to-Peer-Interaktion zu fördern. Der „Peer- 
Agent“ verfügt über weniger Wissen als der „Teaching Agent“. Die „Peer Agents“ 
können die Lernenden jedoch durch einen Lernprozess begleiten. Bei diesem An- 
satz übernimmt der „Teachable Agent“ die Rolle eines Anfängers und bittet die 
Lernenden, ihn durch einen Lernprozess zu begleiten. „Motivational Agents“ tragen 
nicht direkt zum Lernprozess bei, sondern begleiten die Lernenden. Sie fördern 
positives Verhalten und Lernen. Mit Ausnahme einer Studie waren die Chatbots in 
den untersuchten Studien so konzipiert, dass sie nur eine dieser vier Rollen über- 
nehmen konnten. Ein weiteres Merkmal der Chatbots ist ihr Interaktionsstil. Die 
meisten Studien (88,88%) verwendeten einen Chatbot-gesteuerten Interaktionsstil, 
bei dem der Chatbot das Gespräch leitet. 52,77% der Artikel verwendeten flow-ba- 
sierete Chatbots, bei denen die Nutzenden einem bestimmten, vom Chatbot vor- 
gegebenen Lernpfad folgen musste. Die restlichen Artikel (13 Artikel; 36,11%) 
nutzten Chatbots, die einen absichtsbasierten Ansatz verwendeten. Die Idee ist, dass 
der Chatbot das, was Nutzende sagen, mit einer vorgefertigten Antwort abgleicht. 
Nur in vier Artikeln (11,11%) wurden Chatbots eingesetzt, die sich an einer vom 
Nutzenden gesteuerten Konversation beteiligen, bei der der Nutzende die Kontrolle 
über die Konversation hat und der Chatbot nicht über eine vorgefertigte Antwort 
verfügt. Eine solche benutzergesteuerte Interaktion wurde hauptsächlich für 
Chatbots verwendet, die eine Fremdsprache unterrichten. 

Die oben genannten Studien beziehen sich allerdings auf frühere Generationen 
von KlI-Technologien. Neu entwickelte textgenerierende KI-Systeme wie ChatGPT 
weisen indes deutliche Unterschiede zu diesen älteren Versionen auf, indem sie 
zusätzlich zu den oben beschriebenen Funktionen auch neue und erweiterte Rollen 
übernehmen können. Wie ChatGPT zeigt, ist davon auszugehen, dass KI-Textgene- 
ratoren zukünftig immer vielseitiger eingesetzt werden können. Diese Entwicklung 
kann dazu führen, dass die Beziehung zwischen Lehrenden und KI-System im Bil- 
dungsbereich dynamischer und schwerer vorhersehbar wird als bisher. Die Frage, 
wie sich KI-Textgeneratoren wie ChatGPT in den Unterricht integrieren lassen und 
welche Rolle die Lehrkräfte dabei spielen werden, ist jedoch noch wenig erforscht.”° 


19 Mohammad A. Kuhail et al., „Interacting with educational chatbots: A systematic review“, 
Education and Information Technologies, Bd. 28, 2023, 973-1018. 

20 Enkelejda Kasneci et al., „ChatGPT for good? On opportunities and challenges of large language 
models for education“, Learning and Individual Differences, Bd. 103, 2023, 1-9. 
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Doch diese Frage scheint äußert dringlich, wenn man sich vor Augen führt, dass sich 
ChatGPT seit seiner Veröffentlichung am 30. November 2022 zur Anwendung mit 
der schnellsten Verbreitung in der Geschichte entwickelt hat. Im Januar 2023, nur 
zwei Monate nach seinem Start, erreichte ChatGPT 100 Millionen aktive NutzerIn- 
nen.” 

Im Folgenden sollen drei Studien vorgestellt werden, welche die Rolle von 
modernen KI-Technologien für den Unterricht fokussieren. Die erste Untersuchung 
analysierte in einem Rapid Literatur Review 50 Studien in Bezug auf die Leis- 
tungsfähigkeit von ChatGPT in verschiedenen Fächern, den möglichen Einsatz von 
ChatGPT zur Verbesserung von Lehren und Lernen und die potenziellen Probleme 
im Zusammenhang mit der Nutzung von ChatGPT.” In Bezug auf die Leistungsfä- 
higkeit von ChatGPT wurden deutliche Unterschiede in Bezug auf verschiedene 
Fachrichtungen festgestellt (zum Beispiel gute Ergebnisse in Wirtschaftswissen- 
schaft und unzureichende Ergebnisse Mathematik). Die Ergebnisse des Reviews 
legen zudem nahe, dass ChatGPT als Hilfsmittel für sowohl für Lehrende als auch 
für Lernende dienen kann. Der Autor identifizierte basierend auf den Studien fünf 
Hauptfunktionen von ChatGPT für Lehrkräfte. Diese umfassten (1) die Unter- 
richtsvorbereitung, (2) die Erstellung von Unterrichtsmaterialien, (3) das Bereit- 
stellen von Vorschlägen und (4) die Durchführung von Sprachübersetzungen sowie 
(5) die Bewertung der Schülerleistungen durch das Erstellen von Bewertungsauf- 
gaben und deren Auswertung. Für Lernende identifizierte der Autor zwei Haupt- 
aspekte. Diese umfassen (1) das Lernen, wie zum Beispiel die Beantwortung von 
Fragen, Zusammenfassungen von Informationen und Unterstützung bei Gruppen- 
arbeiten sowie Bewertungsprozessen, wie Konzeptüberprüfung und Prüfungsvor- 
bereitung. Darüber hinaus kann ChatGPT (2) die Lernenden auch beim Verfassen 
von Texten unterstützen und Feedback bieten. In dem Review wurden zudem fünf 
Hauptprobleme im Zusammenhang mit ChatGPT im Bildungswesen ermittelt. Diese 
lassen sich in zwei Kategorien einteilen: Genauigkeit und Zuverlässigkeit (insbe- 
sondere das Risiko der Verwendung voreingenommener Daten, begrenztes aktu- 
elles Wissen sowie die Möglichkeit, falsche oder gefälschte Informationen zu ge- 
nerieren) und Plagiatsprävention (einschließlich Schülerplagiate und das Umgehen 
von Plagiaterkennungsmethoden).”* 

Ein weiteres systematisches Review von 102 Studien von Gentile et al. unter- 
suchte die Veränderung der Lehrendenrolle, die durch die Einführung von KI- 


21 Chung K. Lo, „What is the impact of chatgpt on education? A rapid review of the literature“, 
Education Sciences, Bd. 13, 2023, 1-15. 

22 Lo 2023, 1-15. 
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Technologien in das Bildungssystem angestoßen wird.”* Die AutorInnen identifi- 
zierten fünf Untersuchungsgegenstände für ihr Review (Interaktion zwischen 
Lehrenden und Lernenden, Lehrmethoden und -strategien, Lehrinhalte, Bewertung 
und Monitoring der Schüler, professionelle Entwicklung der Lehrkräfte). Die Au- 
torInnen schließen aus dem Review, dass das Aufkommen der KI die traditionellen 
Modelle der Interaktion zwischen Lehrenden und Lernenden erheblich infrage 
gestellt hat. In diesen werden die Interaktionen überwiegend als individuell be- 
schrieben, wobei die Momente des Feedbacks und der Bewertung begrenzt und 
zeitlich auf den Lehrplan abgestimmt sind. KI-unterstützte Technologien können 
laut AutorInnen wertvolle Instrumente sein, um neue Möglichkeiten der Interak- 
tion zu schaffen. Diese können sowohl quantitativ (durch erhöhte Anzahl von In- 
teraktionen) als auch qualitativ (durch effizientere Interaktionen) zur Verbesse- 
rung der Interaktionen beitragen. Allerdings erfordern die neuen KI-Technologien 
ein Umdenken des Lehrens und Lernens. Eine der disruptiven Eigenschaften der KI 
besteht laut AutorInnen darin, dass sie der Technologie Handlungsfähigkeit verleiht 
und die Beziehung zwischen Mensch und Maschine von einer unidirektionalen in 
eine bidirektionale Beziehung verwandelt. Eine solche Verlagerung des Schwer- 
punkts der Unterrichtsprozesse und -modelle von LehrerInnen-zentriert zu Schü- 
lerInnen-zentriert durch KI können die Lehrenden von vielen der Tätigkeiten be- 
freien, die früher ihrer direkten Hilfe oder Aufsicht bedurften. Die AutorInnen 
schließen zudem aus den analysierten Studien, dass KI-Technologien Lehrkräfte bei 
der Gestaltung adaptiver und personalisierter Inhalte und Aktivitäten unterstützen 
kann, die auf das Wissen, die Kompetenzen und die Bedürfnisse der SchülerInnen 
zugeschnitten sind. KI-Technologien können bei der Sammlung und Analyse von 
Lerndaten und dem Bereitstellen von Feedback unterstützen. Die AutorInnen be- 
mängeln jedoch, dass es an einer angemessenen und systematischen Reflexion über 
die Implikationen zu fehlen scheint, die diese neuen Methoden mit sich bringen 
oder bringen werden. Die AutorInnen schließen zudem, dass es mit dem Aufkom- 
men der KI-Technologien neue Arten von Unterrichtsressourcen und Möglichkeiten 
gibt, Unterrichtsressourcen zu erstellen. So können Inhalte organisiert und in 
Echtzeit Hinweise auf das Navigationsverhalten, die Vorlieben und die Nutzungs- 
muster der SchülerInnen erstellt werden. Inhalte können von den SchülerInnen 
selbständig genutzt, gemeinsam erkundet und automatisch entsprechend den 
festgelegten Lernzielen generiert werden. In Bezug auf Bewertungen können KI und 
Learning-Analytics-Techniken Lehrkräfte bei verschiedenen Aktivitäten unterstüt- 
zen, zum Beispiel bei der Bewertung von Hausaufgaben, Tests, schriftlichen Ar- 


24 Manuel Gentile et al., „Do we still need teachers? Navigating the paradigm shift of the teacher’s 
role in the AI era“, Frontiers in Education, Bd. 8, 2023, 1-14. 
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beiten und dem allgemeinen Monitoring von SchülerInnen. Aus dem Review geht 
zudem hervor, dass Lehrkräfte bisher nicht ausreichend geschult sind, um mit 
diesen neuen Möglichkeiten und Herausforderungen umzugehen. Ein häufiges 
Problem sei das niedrige Niveau digitaler Kompetenzen. Um mit der Entwicklung 
des durch die KI eingeführten Bildungsparadigmas zurechtzukommen, müssten 
Lehrkräfte nicht nur in der Nutzung von Technologien geschult werden, sondern 
auch im Verständnis der ihnen zugrunde liegenden Mechanismen. Dabei ist es laut 
den AutorInnen von Bedeutung, dass die Lehrkräfteausbildung über das bloße 
Fachwissen hinaus auch einen Fokus auf die kognitiven Prozesse auf höherer Ebene 
legen sollte, welche den Lernprozess beeinflussen. Kontinuierliche Weiterbildung 
sei dabei grundlegend, um sicherzustellen, dass die Lehrkräfte mit den raschen 
Fortschritten der KI-Technologie Schritt halten können. Die AutorInnen schließen 
aus dem Review, dass man sich der Dringlichkeit, mit der die Herausforderungen 
der KI im Bildungsbereich angegangen werden müssen, nicht ganz bewusst ist.”° 

Eine dritte Studie von Jeon und Lee untersuchte die Beziehung zwischen 
ChatGPT und Lehrenden, wobei der Schwerpunkt auf der Identifizierung der sich 
ergänzenden Rollen beider Seiten im Unterricht lag.” Elf SprachlehrerInnen wur- 
den gebeten, ChatGPT über einen Zeitraum von zwei Wochen für ihren Unterricht 
zu nutzen. Anschließend nahmen sie an Einzelinterviews über ihre Erfahrungen 
teil und stellten Interaktionsprotokolle der Nutzung von ChatGPT zur Verfügung. 
Auf der Grundlage der Interviewdaten und Interaktionstranskripte der Lehrkräfte 
wurden vier Rollen von ChatGPT identifiziert: (1) Gesprächspartner (Rollenspiel, 
interaktives Sprachspiel), (2) Inhaltsersteller (Erstellung und Empfehlung von Ma- 
terialien, Anpassung von Materialien und Bereitstellung von kulturellem Wissen), 
(3) Lehrassistent (Grammatikprüfung, Wörterbuch, Aktivierung von Hintergrund- 
wissen) und (4) Evaluator (Bewertung/Feedback, Evaluation/Test der Materialer- 
stellung, Dialogprotokolle). Abschließend machten die LehrerInnen deutlich, dass 
ChatGPT das Potenzial hat, als wertvolles Unterrichtsmittel zu dienen, das die Un- 
terrichtspraxis bereichern kann. Sie betonten jedoch, dass es in einer Weise ein- 
gesetzt werden muss, die das pädagogische Fachwissen der Lehrerinnen und Lehrer 
auf der Grundlage eines differenzierten Verständnisses ihrer Schülerinnen und 
Schüler und ihres Kontexts ergänzt und verbessert. Die Lehrkräfte waren der An- 
sicht, dass ihr Lehrerberuf mithilfe dieser vielseitigen Technologie in den folgenden 
drei Rollen möglicherweise neu definiert werden muss: (1) Orchestrierung ver- 
schiedener Ressourcen mit hochwertigen pädagogischen Entscheidungen. Dabei 
weisen die Lehrkräfte darauf hin, dass die erhöhte Verfügbarkeit hilfreicher Res- 


25 Gentile et al. 2023, 1-14. 
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sourcen nicht automatisch die Qualität des Unterrichts erhöht. Sie betonten, dass 
dies von den pädagogischen Kenntnissen und dem Urteilsvermögen der Lehrkräfte 
bei der Auswahl von Materialien abhängt, die für die Bedürfnisse ihrer Lernenden 
geeignet sind, und davon, wie effektiv sie diese in ihrem Unterrichtskontext ein- 
setzen. (2) SchülerInnen zu aktiven ForscherInnen und nicht zu passiven Wis- 
sensempfängerInnen machen. Dabei scheint es essenziell, gute Fragen zu formu- 
lieren und effektive Fragetechniken zu modellieren, um hochwertige Ergebnisse 
vom Chatbot zu erhalten. (3) Stärkung des ethischen Bewusstseins für den Einsatz 
von KI. Darunter fällt Transparenz bezüglich des Einsatzes der Technologie und 
Festlegung von Regeln für den ethischen Umgang mit ihr. 

Die AutorInnen folgern, dass das pädagogische Fachwissen der Lehrkräfte 
mithilfe der Fähigkeiten des Chatbots maximiert werden kann. Jedoch verlangt die 
KI-Technologie von den Lehrkräften, dass sie eine noch größere Bandbreite an 
pädagogischen Entscheidungen treffen.” 


4 Konsequenzen für die Rolle der Lehrkraft 


Aus der aufgearbeiteten Literatur lässt sich schließen, dass die Integration von KI- 
Technologien wie Textgeneratoren in den Bildungsbereich das Potenzial hat, die 
Rolle der Lehrkräfte signifikant zu transformieren. Die Forschung deutet darauf 
hin, dass eine synergetische Zusammenarbeit zwischen Lehrkräften und KI-Text- 
generatoren eine effektivere Lernumgebung schaffen kann, als wenn diese Ele- 
mente isoliert eingesetzt werden.” Die Lehrendenrolle wird dabei jedoch nicht 
marginalisiert, sondern erfährt eine Neuausrichtung, bei der Lehrkräfte als Ver- 
mittler und Kooperatoren fungieren, die die positiven Auswirkungen der KI-Text- 
generatoren auf die Bildung maximieren, anstatt sie als potenzielle Bedrohung oder 
Ersatz zu sehen.***” Die Lehrkräfte sind weiterhin zentral in der Gestaltung und 
Orchestrierung des Lernprozesses, wobei sie die KI-Textgeneratoren nutzen kön- 
nen, um ihre pädagogischen Entscheidungen zu unterstützen und zu erweitern. Es 
ist jedoch notwendig, dass Lehrkräfte neue Fähigkeiten erwerben, um die Her- 
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ausforderungen und Möglichkeiten, die diese Technologien mit sich bringen, ef- 
fektiv zu navigieren.” 

Das didaktische Tetraeder eignet sich insofern zum Abbilden von Interaktionen 
im Unterricht, als dass es explizit die Rolle von (digitalen) Technologien im Bil- 
dungsprozess berücksichtigt. KI-Textgeneratoren können als solche Technologien 
betrachtet werden, die den Lernprozess unterstützen und ergänzen und in die vom 
Modell beschriebenen Beziehungsdreiecke integriert werden. Das Tetraeder betont 
die Rolle der Lehrperson bei der Unterstützung der Lernenden bei der Nutzung von 
(digitalen) Technologien. Dies spiegelt die Idee wider, dass KI-Textgeneratoren nicht 
als Ersatz für Lehrkräfte dienen, sondern als Werkzeuge, die von Lehrkräften ef- 
fektiv eingesetzt werden, um den Lernprozess zu verbessern. 

Jedoch kann die Interaktion mit KI-Textgeneratoren komplexer sein als mit 
traditionellen (digitalen) Technologien. Ein Grund hierfür ist die autonome und 
adaptive Natur von KI-Technologien, die in der Lage sind, eigenständige Entschei- 
dungen zu treffen und sich an individuelle Lernbedürfnisse anzupassen. Das Te- 
traeder müsste diese zusätzliche Komplexität berücksichtigen, um die spezifischen 
Herausforderungen und Möglichkeiten von KI-Textgeneratoren im Bildungsbereich 
zu beschreiben. KI-Textgeneratoren bieten zudem die Möglichkeit, zeitliche und 
räumliche Einschränkungen des traditionellen Unterrichts zu überwinden. Die 
Flexibilität, Bidirektionalität und Adaptivität sowie ständige Anpassung und Ent- 
wicklung werden nur unzureichend durch das Tetraeder beschrieben. Des Weite- 
ren bringen KI-Technologien wie Textgeneratoren die Notwendigkeit mit sich, Ethik 
und Verantwortung im Umgang mit diesen Werkzeugen zu fokussieren.** Dies wird 
im klassischen didaktischen Tetraeder nicht angesprochen. Unterricht, wie er bis- 
her durch das didaktische Tetraeder beschrieben wurde, erfährt durch die Inte- 
gration von KI-Textgeneratoren eine signifikante Transformation. Diese Transfor- 
mation geht über die reine Technologieintegration hinaus und berührt 
pädagogische, ethische und organisatorische Aspekte des Bildungsbereichs. 


5 Perspektiven und Herausforderungen 


Aus den vorangegangenen Betrachtungen lassen sich Perspektiven und Heraus- 
forderungen für den Unterricht identifizieren. 

Die Integration von KI-Textgeneratoren erfordert eine Neubewertung der 
Lehrenden-Lernenden-Beziehung. Während Lehrkräfte traditionell als Hauptin- 
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formationsquelle und -vermittler agierten, ermöglichen KI-Textgeneratoren den 
Lernenden, Informationen und Feedback in Echtzeit und auf personalisierte Weise 
zu erhalten. Die dynamische Anpassungsfähigkeit von KI-Textgeneratoren ermög- 
licht somit eine reaktive Gestaltung des Unterrichts. Wenn SchülerInnen Schwie- 
rigkeiten mit einem bestimmten Thema haben, kann das System in Echtzeit rea- 
gieren und alternative Lehrmethoden oder zusätzliche Ressourcen bereitstellen. 
Dies führt zu einem interaktiveren und adaptiven Lernumfeld, welches auch ein 
autonomes und eigenverantwortliches Lernen fördern kann. 

Mithilfe von KI-Textgeneratoren können Lehrkräfte das Unterrichtsmaterial 
einfacher individualisieren, sodass sie den spezifischen Bedürfnissen und Fähig- 
keiten jedes Lernenden entsprechen. So können mit KI-Technologien mafge- 
schneiderte Lernpfade erstellt werden, die den Fortschritt und die Fähigkeiten des 
Lernende berücksichtigen. 

Lehrkräfte werden somit zu Moderatoren des Lernprozesses. Sie sorgen für 
eine angemessene Nutzung und Interpretation der von den KI-Systemen generier- 
ten Informationen und Materialien. Des Weiteren liegt ein Fokus auf der Förderung 
des kritischen Denkens und der Reflexion bei den Schülerinnen und Schülern. Diese 
müssen lernen, die Ergebnisse der KI-Textgeneratoren kritisch zu hinterfragen und 
ihre Genauigkeit, Reliabilität und Relevanz zu bewerten. 

Diese Veränderung der Lehrendenrolle fordert aber auch eine kontinuierliche 
Weiterbildung und Entwicklung der Lehrkräfte, um sicherzustellen, dass sie die 
technischen und pädagogischen Fähigkeiten besitzen, um KI-Textgeneratoren ef- 
fektiv in den Unterricht einzubinden und die SchülerInnen darin zu unterstützen, 
sie kompetent und verantwortungsbewusst nutzen zu können. Die Integration von 
KI-Textgeneratoren in Unterricht, aber auch die Arbeitswelt erfordern von den 
SchülerInnen neue Kompetenzen im Umgang mit diesen Systemen. SchülerInnen, 
die in einem Umfeld aufwachsen, in welchem sie regelmäßig mit fortschrittlichen 
Technologien interagieren und entsprechend geschult werden, könnten besser 
darauf vorbereitet sein, solche Systeme effektiv zu nutzen. Im Gegensatz dazu 
könnten SchülerInnen aus weniger privilegierten Hintergründen Schwierigkeiten 
haben, die spezifischen Anforderungen und Möglichkeiten solcher Systeme zu 
verstehen und zu nutzen. Dies könnte wiederum zu einer Situation führen, in der 
einige SchülerInnen in der Lage sind, KI-Textgeneratoren optimal für ihre Lern- 
bedürfnisse zu nutzen, während andere zurückbleiben. Des Weiteren besteht die 
Gefahr, dass eine übermäßige Nutzung von KlI-Systemen zu einer Reduktion 
menschlicher Interaktionen im Unterricht führt. Menschliche Interaktionen sind 
jedoch nicht nur für den Wissensaustausch, sondern auch für die Entwicklung so- 
zialer Fähigkeiten, Empathie und kritischen Denkens unerlässlich. Während KI- 
Textgeneratoren Informationen präsentieren und sogar auf individuelle Lernbe- 
dürfnisse reagieren können, fehlt ihnen die Fähigkeit, emotionale Intelligenz, kul- 
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turelle Nuancen und den Kontext, in dem das Lernen stattfindet, zu verstehen und 
darauf zu reagieren. 

Zudem sind KI-Textgeneratoren datengetrieben und nicht theoriebasiert. Dies 
bedeutet, dass sie aufgrund ihrer Datenbasis und des zugrunde liegenden Algo- 
rithmus Entscheidungen treffen, Material generieren und Vorschläge machen 
können, die nicht unbedingt pädagogisch oder ethisch fundiert sind. Für Zwecke, 
die (noch) nicht in den Trainingsdaten enthalten sind, wie beispielsweise Lern- 
diagnostik, könnte die Verwendung von KI-Textgeneratoren zu ungenauen oder 
irreführenden Informationen führen. Nutzende sollten daher immer einen kriti- 
schen und bewussten Umgang mit diesen Werkzeugen pflegen. 

Des Weiteren gibt es erhebliche Forschungslücken, was die Wirksamkeit von 
KI-Textgeneratoren im Bildungskontext angeht. Es sind umfassende, langfristige 
und groß angelegte Studien notwendig, um fundierte Schlussfolgerungen über die 
allgemeine Effektivität, die besten Anwendungspraktiken und die Folgen von KI- 
Textgeneratoren für den Unterricht zu ziehen. 

Darüber hinaus erfordert die Einführung von KlI-Textgeneratoren im Bil- 
dungsbereich eine tiefgreifende Reflexion über ethische Fragen, den Datenschutz, 
Transparenz im Umgang und Bias. Es ist unerlässlich, dass Richtlinien und Best 
Practices entwickelt werden, um sicherzustellen, dass KI-Textgeneratoren ethisch 
und verantwortungsbewusst eingesetzt werden. 


6 KI-Textgeneratoren - eine neue Ära des 
Unterrichts? 


Wie aus den vorangegangenen Überlegungen geschlossen werden kann, haben KI- 
Textgeneratoren das Potenzial, eine neue Ära des Unterrichts einzuläuten. Der 
Einsatz von solchen Systemen in den Unterricht bringt nicht nur eine Reihe von 
vielversprechenden Potenzialen mit sich. In einer Welt, in der KI-Technologien 
immer präsenter werden, ist es unerlässlich, dass Schülerinnen und Schüler nicht 
nur als passive NutzerInnen dieser Systeme agieren, sondern auch ein tiefes Ver- 
ständnis für ihre Funktionsweise und ihre Grenzen entwickeln. Jedoch birgt die 
Einbindung von KI-Textgeneratoren in den Unterricht auch eine Reihe von Her- 
ausforderungen mit sich. Es besteht die Gefahr, dass ohne eine sorgfältige Imple- 
mentierung und Überwachung KI-Textgeneratoren unbeabsichtigte negative Aus- 
wirkungen haben könnten. Es ist von entscheidender Bedeutung, dass die 
Forschungsgemeinschaft, Bildungseinrichtungen und politische Entscheidungsträ- 
ger diese Herausforderungen proaktiv angehen, um sicherzustellen, dass KI im 
Bildungsbereich auf eine Weise eingesetzt wird, die sowohl effektiv als auch ethisch 
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vertretbar ist. Nur durch eine solche kooperative und vorausschauende Herange- 
hensweise können wir sicherstellen, dass KI-Technologien in einer Weise eingesetzt 
werden, die das Lernen bereichert, ohne die Grundprinzipien der Bildung zu un- 
tergraben. 


Antonia Sahm 
Large Language Models in der Medizin 


Foucault als Wegweiser für medizinethische Debatten 


Abstract: The use of Large Language Models (LLMs) in medicine has been increa- 
singly discussed since the publication of ChatGPT in the fall of 2022.1 On the one 
hand, LLMs could be a great help in medical research and practice, on the other 
hand, concerns about their use and risks have been raised. Debates in medical 
ethics about the development of LLMs must consider the practice of these tools 
without full knowledge of their capabilities, as they have not yet been fully tested 
with all their implications. To guide these debates, Michel Foucault’s perspective on 
the combination of medical knowledge, scientific practices, and social effects can be 
helpful. In this way, a Foucauldian perspective is used to critically assess the impact 
of LLMs in medicine and to convey the implications that need to be considered in 
their use. The paper aims to shift the perspective to theoretical and social exclusions 
that could be caused by LLMs in medicine and raises questions that can guide de- 
bates in medical ethics. 


1 KI-Textgeneratoren in der Medizin - Ein 
Rückgriff auf Foucault 


Seit der Veröffentlichung von ChatGPT im Herbst 2022 wird zunehmend diskutiert, 
Large Language Models (LLMs) auch in der Medizin anzuwenden.” Noch sind KI- 
Textgeneratoren in der Medizin nicht umfassend im Einsatz, doch existieren schon 
einige Modelle, die auf die medizinische Nutzung spezialisiert werden.** Die An- 
wendung von LLMs ist in vielfältiger Weise in der medizinischen Praxis und For- 
schung denkbar.’ Im Bereich der Forschung könnten sie zur Übersetzung von Daten 


1 Bert Gordijn et al., „ChatGPT: Evolution or Revolution?“, Medicine, Health Care and Philosophy, 
Bd. 26, 2023, 1-2, 2. 

2 Bert Gordijn et al., „What's wrong with black box AI?“, Medicine, Health Care and Philosophy, 
Bd. 26, 2023, 283-284, 283. 

3 Hanzhou Li et al., „Ethics of large language models in medicine and medical research“, The Lancet. 
Digital Health, Bd. 5(6), 2023, e333-e335. 

4 Jesutofunmi Omiye et al., ,Large language models in medicine: the potentials and pitfalls“, 
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in intelligible Texte genutzt werden. Die Erstellung von Reviews, die den For- 
schungsstand zu einem Thema prägnant bündeln, könnte beispielsweise durch KI- 
Textgeneratoren geleistet werden. Über eine Zeitersparnis und Entlastung For- 
schender hinaus’ ist anzunehmen, dass KI-Textgeneratoren größere Datenmengen 
einbeziehen und somit umfassendere Übersichten erzeugen können als der 
Mensch.? Durch ihr algorithmisches Verfahren sind sie zudem nicht irritabel durch 
Interaktionen mit ihrer Umwelt und könnten im besten Fall neutrale und aus- 
führliche Übersichten generieren.”'° 

Im klinischen Setting könnten sie bürokratische Tätigkeiten wie beispielsweise 
die Erstellung von Arztbriefen übernehmen. Arztbriefe dienen als wichtige Doku- 
mente zur Übermittlung von Gesundheitsinformationen und sind fehleranfällig, da 
sie häufig unter Zeitdruck erstellt werden.’ KI-Textgeneratoren könnten hier eine 
Hilfestellung bieten, wenn beispielsweise aus Daten, wie Medikamentendosierun- 
gen, OP-Berichten und Anamnese direkt ein Arztbrief generiert würde.'” Überdies 
wäre es für die Zukunft vorstellbar, dass algorithmische Handlungsanweisungen 
wie Standard Operating Procedures (SOPs)von KI-Textgeneratoren erstellt werden 
könnten. Gerade dort, wo eine umfassende Reflexion der Handlungen aufgrund von 
Zeitdruck nicht möglich ist, könnte ein Abgleich von Symptomen und Diagnosen 
schnell und umfassend in eine Handlungsempfehlung übersetzt werden. Auch die 
Aufbereitung von komplexen Fachinformationen für Laien, beispielsweise in Form 
von Health-Apps,'*"* könnten LLMs leisten. Diese genannten Beispiele sind nur 
wenige von möglichen Einsatzbereichen von LLMs in der Medizin. 

Betrachtet man die Abläufe von Forschung und Praxis in der Medizin, so treffen 
technische Entwicklungen hier auf ein System mit hoher Arbeitsbelastung und 
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begrenzten Ressourcen’® — also mit einem hohen Bedarf an Verbesserungen und 
vielen möglichen Einsatzorten für KI. Gerade in der Medizin, die sich direkt auf 
Menschen auswirkt und sicherstellen muss, dass ihre Handlungen nicht zu Lasten 
der Patient:innen gehen,"® sollten Risiken von LLMs vor ihrem breiten Einsatz de- 
tektiert werden. So zielen ethische Überlegungen darauf ab, einen verantwor- 
tungsvollen Einsatz dieser Tools vor der umfassenden Erprobung sicherzustellen. 
Es ist nicht klar, ob alle Risiken bislang erfasst wurden und technisch behoben 
beziehungsweise kontrolliert werden können. Auch besteht Unsicherheit darüber, 
welche Risiken sich durch eine Weiterentwicklung in absehbarer Zeit vermeiden 
lassen. Aus diesem Grund kann es für die ethische Reflexion der Anwendung von 
LLMs hilfreich sein, die algorithmische Arbeitsweise der Texterstellung selbst in 
den Blick zu nehmen und auf Theorien zurückzugreifen, die wissenschaftliche 
Methoden mit ihren sozialen Auswirkungen schon zuvor untersucht haben. 

Michel Foucault hat in seinem umfangreichen Werk Wissenssysteme und ins- 
besondere das Wissen der Medizin mit seinen gesellschaftlichen Implikationen in 
den Blick genommen.” Er hat aufgezeigt, auf welche Weise sich Wissen und Macht 
verschränken, voneinander abhängen und politisch wirksam werden können.’ 
Fragen danach, was medizinisches Wissen ist, wie es Gültigkeit erlangt und welche 
Auswirkungen es auf gesellschaftliche Zusammenhänge und Ungleichheiten haben 
kann, haben seine Arbeiten für die Politische Theorie, Sozialphilosophie und Ethik 
relevant gemacht. In Debatten um die Anwendung von KI-Textgeneratoren gewin- 
nen Foucaults Überlegungen nun erneut an Relevanz, da hier wissenschaftstheo- 
retische Fragen mit ihren ethischen Auswirkungen im Kontext der Medizin re- 
flektiert werden müssen. Die Bezüge, die sich zwischen theoretisch generiertem 
Wissen, das sich auf den Körper bezieht, und sozial wirksamer Macht ergeben, 
können aus der Perspektive Foucaults detailliert betrachtet werden. Seine Überle- 
gungen beleuchten Zusammenhänge, die bei ethischen Diskussionen um wissen- 
schaftliche Praktiken Beachtung finden sollten. Für die Diskussion um LLMs in der 
Medizin lassen sich daraus Fragen ableiten, die medizinethische Debatten hilfreich 
erweitern und verorten können. 

Nachfolgend werden zunächst Risiken von LLMs skizziert, die vielfach in der 
Literatur benannt sind. Anschließend sollen Grundzüge der Untersuchungen Fou- 
caults schlaglichtartig vorgestellt und im Kontext von LLMs verortet werden. Ab- 
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schließend werden die Risiken in der Anwendung von LLMs vor dem Hintergrund 
von Foucaults Uberlegungen vertieft diskutiert. Auf diese Weise werden Implika- 
tionen deutlich, die die Anwendung von LLMs bergen kann, und es werden Fragen 
herausgearbeitet, die ethische Debatten hilfreich erweitern können. 


2 Risiken und Bedenken beim Einsatz von 
KI-Textgeneratoren in der Medizin 


In der Literatur sind einige Risiken und Bedenken, die mit der Nutzung von LLMs 
einhergehen, benannt worden. Vielfach angeführt werden die Voreingenommen- 
heit von LLMs'””°?' und ungeklärte Haftungsfragen?””*”* bei der Anwendung. 

Die Voreingenommenheit ergibt sich daraus, dass LLMs Vorannahmen nicht 
überprüfen. Sie neigen dazu, mit ihren Outputs ihre ursprünglichen Trainingsdaten 
zu bestätigen oder Daten, die diesen Ausgangsinformationen ähneln, wiederzuge- 
ben.”°”® In der praktischen Anwendung am Individuum oder bei der Datenerhe- 
bung in Kollektiven können sie auf diese Weise Inhalte produzieren, die Stereotype 
bestätigen oder Marginalisierung und Ausschlüsse von Personengruppen bestär- 
ken.” In der Praxis zeigt sich auch, dass sie widersprüchliche Inhalte generieren 
beziehungsweise unsichere Daten überzeugend darstellen können.”® 

Wie andere Formen des Maschinellen Lernens werden sie zudem als black box 
bezeichnet, da teilweise nicht mehr nachvollzogen werden kann, auf welche Weise 
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der Output generiert wurde.””°”° Wendet man sie im medizinischen Kontext an, 
ergeben sich daraus Haftungsfragen, denn medizinische Handlungsanweisungen 
sollten aufgrund von Expertise gegeben werden, und die Verantwortung und Ur- 
heberschaft für die Inhalte muss geklärt sein.***” In den medizinethischen Dis- 
kussionen um KI wird aus diesem Grund darauf verwiesen, dass es der Kontrolle 
der Arbeitsweise von KI und der gespeisten Daten bedarf.**** 

In einer Stellungnahme hat die Zentrale Ethikkommission der Bundesärzte- 
kammer 2021 zu Systemen maschinellen Lernens die oben genannten Bedenken 
allgemein formuliert. In ihrer Empfehlung kommt Arzt:innen eine tragende Rolle 
dabei zu, diese Tools verantwortungsvoll einzusetzen, beziehungsweise deren Ar- 
beitsweise zu kontrollieren." Der Deutsche Ethikrat hat diese Aufgabe nicht den 
Arzt:innen zugeschrieben, sondern allgemein auf die Notwendigkeit hingewiesen, 
diese Tools zu kontrollieren, um Risiken bei der Anwendung in der Medizin ein- 
zudämmen.”° Die benannten Risiken ähneln und überschneiden sich in der Lite- 
ratur, was ihre Relevanz bestärkt. Doch bleibt unklar, wie den Risiken konkret 
vorgebeugt werden kann, ob es überhaupt möglich ist, diese Tools zu kontrollieren 
und welche Personengruppe diese Kompetenz besitzt. So wird beispielsweise auch 
dafür plädiert, dass die Verantwortung für die Tools nicht vollständig an Anwender: 
innen abgegeben werden soll, sondern, dass die Entwickler:innen von LLMs für ihre 
Sicherheit garantieren müssen.” 

Insgesamt zeigt sich eine Tendenz, KI-Textgeneratoren als Werkzeug und nicht 
als selbstständige Entitäten im medizinischen Bereich zu verstehen.?® Sie können 
Ärzt:innen aufgrund von zwischenmenschlichen, nonverbalen Interaktionen und 
mangelnder Reflexion ihrer Inhalte nicht ersetzen.”° Der zwischenmenschliche 
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Aspekt und die klinische Erfahrung beziehungsweise Besonderheiten des episte- 
mischen und moralischen Status der Arzt:innen werden dabei als Komponenten 
angeführt, die es in der Medizin zu erhalten gilt.*°* 


3 Wissen und Ausschluss - Impulse von Foucault 


Nachfolgend soll eine Grundthese vorgestellt werden, die in Foucaults Werk wie- 
derkehrend verhandelt wird. Diese These kann im vorliegenden Beitrag zwar nicht 
in all ihren Facetten diskutiert werden, doch kann sie ein grundlegendes Muster 
seines Denkens offenlegen. Es handelt sich dabei um die These, dass Wissen theo- 
retische und praktische Ausschlüsse hervorbringen und ein bestimmtes Verständ- 
nis von Vernunft eine Geste der Zäsur®” darstellen kann. Einerseits hat Foucault 
diese These theoretisch in der Arbeitsweise der Humanwissenschaften unter- 
sucht,** andererseits hat er diesen Zusammenhang mit seinen praktischen Aus- 
wirkungen betrachtet. Im Vordergrund seiner Ausführungen steht dabei die Frage, 
wie Wissen in sozialen Ausschlüssen münden und Machtverhältnisse hervorbrin- 
gen beziehungsweise bestärken kann.***° 

Für den vorliegenden Beitrag soll Foucaults These kurz im Hinblick auf theo- 
retische und praktische Ausschlüsse dargelegt werden und als Grundlage dienen, 
die ethische Reflexion über den Einsatz von LLM in der Medizin anzuleiten. Anhand 
der Überlegungen Foucaults wird deutlich, inwiefern wissenschaftliche Praktiken 
und auch der Einsatz von LLMs in der Medizin die Weise, in der Diskurse geführt 
und sozial wirksam werden, beeinflussen können. 


3.1 Die ausschließende Methode - die theoretische Zäsur 


Foucault verweist in seinen Werken immer wieder darauf, dass Methoden und 
Prozeduren der Wissensgenerierung nicht als neutral verstanden werden können. 
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Diese These verfolgt er beispielsweise in Wahnsinn und Gesellschaft, wenn er auf- 
zeigen will, dass Descartes‘ Methode des Zweifels eine theoretische Grundlage für 
die Internierung der Wahnsinnigen im 17. Jahrhundert geliefert hat. Der Cartesia- 
nischen Zweifel ist bei Foucault ein Instrument, um eine Gemeinschaft der Ver- 
nünftigen zu begründen und Wahnsinnige zu erkennen und auszuschließen. In 
seiner Lesart folgt aus der Methode des Zweifels, dass all diejenigen als vernünftig 
gelten, die eine Cartesianische Vorgehensweise verfolgen können. Als wahnsinnig 
werden all diejenigen bezeichnet, die eine solche vernünftige Methode nicht be- 
folgen können. Sie werden aus der Gesellschaft ausgeschlossen.“ Foucault zeigt mit 
diesem Beispiel, dass eine gewisse Methode zum Merkmal der Vernunft und der 
gültigen Erkenntnis wurde. Die Form einer Aussage ist in Foucaults Lesart aus- 
schlaggebender als ihr Wahrheitsgehalt.” Foucault kritisiert diese Struktur und 
problematisiert, dass all das, das nicht exakt unter die verlangten Kriterien fällt, als 
Erkenntnis nicht mehr erscheinen kann. Es wird in den Raum der Unvernunft 
verbannt. Foucault beschreibt in seinem Beispiel den Cartesianischen Zweifel als 
Geste einer Zäsur® und ausschließende Operation.“ Seine Lesart lässt die Frage 
laut werden, ob es Methoden gibt, die nur gewisse Inhalte erscheinen lassen und 
andere Inhalte verdrängen. 

Mit Foucault auf wissenschaftliche Methoden zu schauen, bedeutet, nach dem 
„Verkennen“” und dem Ungedachten™ zu fragen - also auch den Bereich in den 
Blick zu nehmen, den die vernünftige Methode nicht abbilden kann. Im Hinblick auf 
KI-Textgeneratoren in der Medizin ergeben sich aus dieser Perspektive Fragen, die 
für ethische Debatten relevant sein können: Kann eine algorithmische Arbeitsweise 
alle Formen von Inhalten abbilden, die für eine Wissenschaft relevant sind? Was ist 
das Element, das möglicherweise nicht algorithmisch abgebildet werden kann? Wie 
kann der Verlust von Inhalten sichtbar bleiben, wenn algorithmisch arbeitende 
Tools vermehrt in wissenschaftlichen Diskursen eingesetzt werden? 
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3.2 Wissen und Macht - die praktische Zäsur 


Foucault stellt an vielen Stellen die Neutralität von Wissen in Frage und betont, dass 
Wissen von Machtverhältnissen abhängt und auf diese zurückwirkt. In einigen 
Werken beispielsweise in Wahnsinn und Gesellschaft?” oder auch in Überwachen 
und Strafen°® geht er auch konkreter als oben dargestellt auf die juridischen und 
politischen Auswirkungen von Wissen ein. 


Man muß wohl der Denktradition entsagen, die von der Vorstellung geleitet ist, daß es Wissen 
nur dort geben kann, wo die Machtverhältnisse suspendiert sind, daß das Wissen sich nur 
außerhalb der Befehle, Anforderungen, Interessen der Macht entfalten kann. [...] Eher ist wohl 
anzunehmen, daß die Macht Wissen hervorbringt (und nicht bloß fördert, anwendet, aus- 
nutzt); daß Macht und Wissen einander unmittelbar einschließen; daß es keine Machtbezie- 
hung gibt, ohne daß sich ein entsprechendes Wissensfeld konstituiert, und kein Wissen, das 
nicht gleichzeitig Machtbeziehungen voraussetzt und konstituiert, [...] die Formen und Be- 
reiche der Erkenntnis werden vom Komplex Macht/Wissen, von den ihn durchdringenden und 
konstituierenden Prozessen und Kämpfen bestimmt.” 


Wenn, wie Foucault darlegt, Wissen und Macht einander durchwirken, kann Wis- 
sen praktische Ausschlüsse beispielsweise von Personengruppen nach sich ziehen. 
Seine Untersuchungen der Delinquenten® und Wahnsinnigen®® analysieren diese 
Struktur des Ausschlusses, und er zeigt die „Verzahnung von Machtwirklichkeit und 
Wissensgestand“°” auf. „Die Macht vollzieht sich über den Diskurs, denn der Diskurs 
ist selbst ein Element in einem strategischen Dispositiv aus Machtbeziehungen.“°® 
In dieser Verzahnung spielen Dispositive - also Themen und Überbegriffe, zu denen 
Wissen generiert wird — eine entscheidende Rolle. Sie wirken strategisch, bezie- 
hungsweise instrumentell, da das Wissen über Dispositive in Kräfteverhältnisse 
eingreifen kann.’ 

Aus dieser kurzen Darstellung zeichnet sich schon der Blickwinkel ab, von dem 
Foucaults Untersuchungen ausgehen. Dabei ergeben sich weitere Fragen, die sich 
mit den oben gestellten verbinden lassen: Können algorithmisch generierte Inhalte 
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eine Wirkung auf medizinische Dispositive haben und somit auf Rechtsprechung 
und Politik Einfluss nehmen? Können Vormachtstellungen in Diskursen durch al- 
gorithmische Arbeitsweisen verfestigt werden und womöglich durch eine einseitige 
medizinische Wissensgenerierung Definitionen von Krankheit, Schuldfähigkeit 
oder Delinquenz verändert werden? Und allgemein formuliert: Welche Auswir- 
kungen kann eine vermehrte Integration algorithmischer Arbeitsweisen in der 
Medizin auf das Verständnis von Krankheit haben? 


4 LLMs in der Medizin - Foucault als Wegweiser 
für ethische Debatten 


Ein Blick auf die Risikobewertung von LLMs allgemein und für die Medizin im 
Speziellen offenbart große Einheitlichkeit. Es werden — wie oben dargestellt — 
Voreingenommenheit, die geringe Erklärbarkeit der Ergebnisse, mangelnde 
Transparenz und Kontrolle als Kritikpunkte an LLMs genannt. Die Überlegungen 
zur Anwendung in der Medizin münden häufig in der Konklusion, diese Mängel 
durch technische Weiterentwicklung und menschliche Kontrolle der Tools in der 
Anwendung oder Entwicklung zu beheben.‘ 

In Abschnitt 3 wurde versucht, mithilfe von Foucaults Überlegungen eine 
Perspektive zu eröffnen, die den Blick auf theoretische und soziale Ausschlüsse 
lenkt, die der Einsatz von LLMs zur Folge haben kann. Der Hinweis darauf, dass 
wissenschaftliche Methoden Ausschlüsse hervorrufen können und mit Machtfra- 
gen verknüpft sind, beleuchtet die Interaktionen der medizinischen Praktiken mit 
ihrem gesellschaftlichen Rahmen. Diese Perspektive stellt einerseits in Frage, dass 
LLMs als neutrale Werkzeuge verstanden werden können, und andererseits ergibt 
sich daraus ein Plädoyer, den Einsatz von LLMs in der Medizin nicht gesondert von 
gesellschaftlichen Schauplätzen zu analysieren. Basierend auf diesen beiden 
Schwerpunkten, sollen nachfolgend die benannten Risiken, die mit der Nutzung von 
LLMs einhergehen, diskutiert werden. 
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4.1 LLMs und die Geste der Zasur 


LLMs bergen - wie dargestellt — das Risiko, voreingenommen zu sein und Inhalte zu 
generieren, die ihre Ausgangsdaten bestätigen.‘ „Vorannahmen über ‚normale‘ 
Körper“‘* bestimmen, wie Maschinen Pathologien bewerten.® So wird mangelnde 
Neutralität menschlich verfasster Texte durch eine algorithmische Generierung 
nicht ausgemerzt. LLMs sind nicht von gesellschaftlichen Annahmen und Werten 
unabhängig, da diese immer auf die Dateneinspeisung einwirken. Durch das algo- 
rithmische Verfahren entsteht aber eine unbeeinflussbare Abfolge. Algorithmen 
können keine Gewichtung von Werten vornehmen.® Sie sind damit weder voll- 
ständig blind gegenüber gesellschaftlichen Einflüssen, noch sind sie in ihrer 
Grundstruktur variierbar oder zu Reflexionsleistungen fähig.°” Während der Ge- 
nerierung von Inhalten sind sie durch Umwelteinflüsse, Assoziationen, Wertset- 
zungen nicht ebenso zu beeinflussen wie der Mensch. Sie vollziehen damit eine 
Geste der Zäsur“® mit ihrer lebendigen Umwelt. Somit weisen sie eine andere Ri- 
sikokonstellation als Menschen auf. Dort wo der Mensch korrigierbar oder irritabel 
ist, sind es Algorithmen nicht. Sie sind „gewissenhaft gewissenlos“® und „als 
Technologien [...] nicht als ‚neutrale‘ Entitäten zu analysieren“”, Hingegen können 
sie unsere Biases sogar verstärken.” Sie blicken in die Richtung, auf die hin sie 
ausgerichtet sind, und haben keine umfassende Perspektive. 

Eine erste Intuition mag dazu verleiten, dass man das Problem der Voreinge- 
nommenheit in Zukunft durch Kontrolle der eingespeisten Daten ausräumen oder 
reduzieren kann. Gestaltet man diese Daten vielfältiger, indem beispielsweise un- 
gewollten Annahmen über Körpernormen durch eindimensionale Dateneinspei- 
sung vorgebeugt wird, könnte man diskriminierenden Outputs entgegenwirken. 
Blickt man auf die medizinische Arbeitsweise, so zeigt sich, dass eine körperliche 
Norm in vielfältiger Weise vorausgesetzt wird.” Die Orientierung an einer kör- 
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perlichen Norm ist ein Kernelement medizinischer Diagnosen, um Pathologien zu 
detektieren. Die Grenze zwischen sozialer Vielfalt und medizinischer Diagnose ist 
nicht immer eindeutig. Sie muss von der Medizin und Ethik grundsätzlich in den 
Blick genommen werden. Im Kontext von algorithmisch arbeitenden Tools gewinnt 
sie erneut an Bedeutung. Es ergibt sich hier die Frage, inwieweit es in der Medizin 
überhaupt möglich ist, eine körperliche Vielfalt theoretisch in den Trainingsdaten 
von LLMs vorauszusetzen, wenn gleichzeitig geringe Abweichungen von einer 
Norm zur verbesserten Diagnosestellung notwendig sind. So scheinen hier zwei 
grundsätzlich gegenläufige Bestrebungen aufeinander zu treffen: einerseits die 
Engführung einer körperlichen Norm zur sensiblen Diagnosestellung und ande- 
rerseits die möglich breite Festlegung eben dieser Norm. Im Kontext von LLMs muss 
aus diesem Grund von Neuem die Frage aufgeworfen werden, wie sich diese beiden 
konträren Tendenzen in der Medizin vereinen lassen. 

Mit Foucault auf die Voreingenommenheit von LLMs zu blicken, bedeutet, nach 
dem Bereich zu fragen, der ausgeschlossen wird, der nicht mehr im Blickfeld er- 
scheint”? und einen blinden Fleck’* darstellt. Aus seiner Perspektive könnte mit 
vermehrtem Einsatz von LLMs das Ausmaß dieses blinden Flecks größer werden. 
Gewinnen algorithmisch generierte Erkenntnisse Überhand, so können Inhalte, die 
sich nicht algorithmisch erfassen lassen, in den Hintergrund rücken. Wissen- 
schaftliche Diskurse könnten durch die vermehrte Anwendung von LLMs eindi- 
mensional und intransparent werden. Auch wenn man Foucault nicht in allen 
Punkten folgen möchte, so sensibilisieren seine Überlegungen dafür, zu untersu- 
chen, ob LLMs mehr als andere Arbeitsweisen mit Voreingenommenheit und 
Ausschlüssen assoziiert sind. 

Um Ausschlüssen von relevanten Inhalten in der Anwendung von LLMs vor- 
zubeugen, kann es hilfreich sein, zu definieren, was LLMs nicht können. Inhalte, die 
erfahren werden müssen, können gerade in der medizinischen Bewertung eine 
große Rolle spielen. Zwar können KI-Textgeneratoren keine subjektiven Erfah- 
rungsberichte erstellen, sondern diese nur nachahmen.”® Doch wie ist das Element 
präzise definiert, das ihnen entgeht, das beispielsweise den besonderen epistemi- 
schen Status von Ärztinnen”? ausmacht? Der Einsatz von KI-Textgeneratoren in der 
Wissenschaft verlangt nach einer Definition dessen, was sie sind und auch einer 
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Definition dessen, was sie nicht sind und was sie nicht können.” Eine präzise Ne- 
gativdefinition von LLMs könnte sicherstellen, diese Eigenschaften, die verdrängt 
werden könnten und relevant für die Medizin sind, weiterhin in medizinischen 
Diskursen abzubilden. 

Der Lösungsvorschlag, dass Arzt:innen oder Entwickler:innen den Einsatz von 
LLMs kontrollieren, scheint naheliegend. Bei näherer Betrachtung der Fähigkeiten 
und Arbeitsweise von LLMs ist aber fraglich, wer diese Kompetenz besitzen kann — 
insbesondere dann, wenn sie sich als black boxes prasentieren.”® KI kann mittler- 
weile zur Prüfung von Texten eingesetzt werden und feststellen, ob Texte Computer- 
generiert oder von Menschenhand entstanden ist. Menschen wiederum fällt diese 
Unterscheidung nicht leicht.” Dieses Beispiel zeigt, dass man teilweise KI benötigt, 
um KI zu kontrollieren. Möchte man KI-Textgeneratoren als Werkzeuge oder 
Hilfsmittel verstehen, müssen Personen in der Lage sein, diese anzuwenden und zu 
kontrollieren.®° Reizen LLMs die Definition eines Werkzeugs an dieser Stelle aus? 

Die Zukunftsvision eines konstruktiven Zusammenspiels von LLMs und Ärzt: 
innen muss vertieft diskutiert werden, denn die Ausschluss-These Foucaults und die 
Tatsache, dass LLMs black boxes sind, stellt in Frage, dass sich die Voreingenom- 
menheit der LLMs vollständig kontrollieren und ausmerzen lässt. Nimmt man mit 
Foucault die theoretischen Hintergründe von LLMs in der Medizin in den Blick, so 
ist fraglich, ob sie als neutrale Werkzeuge bewertet werden können. 


4.2 Algorithmisches Wissen über Körper im sozialen Raum 


Ein Ertrag der Arbeiten Foucaults besteht darin, dass er Diskurse in der Interaktion 
mit ihren gesellschaftlichen und historischen Gegebenheiten betrachtet. Möchte 
man die Auswirkung, die algorithmisch generierte Texte auf die Medizin haben, 
untersuchen, dann ist es von Vorteil, auch die Interaktionen der Medizin mit po- 
litischen und gesellschaftlichen Interessen in den Blick zu nehmen. Medizinische 
Arbeitsweisen sind nicht gesondert von gesellschaftlichen Gegebenheiten zu be- 
fragen. Wissenschaftliche Praktiken der Medizin unterliegen Rahmenbedingungen 
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und wirken auf diese zuriick.* Im Hinblick auf LLMs bedeutet das, dass derartige 
Tools eine Vormachtstellung in Diskursen einnehmen können, da sie schnell große 
Datenmengen miteinbeziehen können. Erkenntnisse der Medizin wirken unmit- 
telbar im sozialen Raum. Sie können als KI-generierte Arztbriefe von Patient:innen 
mit nach Hause genommen werden oder als OP-Bericht unter Kolleg:innen kur- 
sieren und deren Urteil beeinflussen. So ist es hilfreich, die Frage der Anwendung 
von LLMs in der Medizin mit ihrem gesellschaftlichen Rahmen gemeinsam zu be- 
antworten, und „es gehört zum techniksoziologischen Konsens, dass die Analyse 
von Technologie über ihre rein technische Funktion hinausgehen muss.“®” 

Medizinisches Wissen ist ein in besonderer Weise sensibles Wissen. Es ist ein 
Wissen um Definitionen von Andersartigkeit, die in diesem Kontext als Diagnosen 
beschrieben werden. Das neutrale Beschreiben von Pathologien und Andersartig- 
keit ist der Medizin nicht möglich” und im Laufe der Geschichte mit fatalen Aus- 
wirkungen misslungen. Es kann Grundlagen bieten, wenn Bestätigungen für Un- 
gleichbehandlungen und praktische Ausschlüsse von Personen gesucht werden. Die 
Bedeutung medizinisch erfasster Unterschiede wird von der ethischen Reflexion 
und öffentlichen Debatten beeinflusst oder sogar bestimmt. Entscheidende Ände- 
rungen in den Verfahrensweisen der Medizin können somit immer soziale Trans- 
formationen hervorbringen,°* „schließlich definiert sich ein Wissen durch die 
Möglichkeit der Benutzung und Aneignung, die vom Diskurs geboten werden.“” 
Welchen Ideologien könnte ein algorithmisch generiertes Wissen in die Hände 
spielen? Positionen, die Vielfältigkeit garantieren wollen, könnten durch den Ein- 
satz von Sprachmodellen vermindert abgebildet werden, wenn LLMs wie oben 
beschrieben scheuklappenartig vorgehen. 

Auch die ethische Reflexion der medizinischen Praktiken muss auf neue An- 
forderungen reagieren und ist immer mitbetroffen, wenn die Praxis sich ändert. Sie 
darf jedoch nicht kurzfristigen Impulsen folgen. So sollte nicht nur danach gefragt 
werden, wie gerechte Daten eingespeist werden können, sondern auch wie Dis- 
kussionen um Gerechtigkeit, Freiheit etc. lebendig bleiben können, wenn aufgrund 
des vermehrten Aufkommens algorithmischer Arbeitsweisen eine festgelegte De- 
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finition notwendig scheint.?° Die Reflexion des Einsatzes von LLMs scheint darin zu 


münden, dass ein unumstößlicher Ausgangspunkt verlangt wird, der in der An- 
wendung fortwirkt. Was aber sind gerechte Daten? Ist eine Festlegung sinnvoll, 
insbesondere wenn diese präskriptiv im Zuge der Trainingsphase von LLMs ge- 
troffen werden muss?” KI wirkt auf die ethischen Betrachtungen ihrer Anwendung 
zurück, sie fordert Entscheidungen und Positionierungen an Stellen, an denen 
Diskussionen aus guten Gründen lebendig bleiben müssen. Ein Rückgriff auf Fou- 
caults These des Ausschlusses kann hilfreich sein, einen umfassenden Blick auf 
diese Zusammenhänge zu wahren und Bereiche zu detektieren, denen im Rahmen 
einer ethischen Reflexion Beachtung geschenkt werden sollte. 
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Aktuelle und zukünftige Herausforderungen durch Text-KI für die 
Bearbeitung von Quellen in der Geschichtswissenschaft 


Abstract: In this article, we explore the impact of text-based AI and Large Language 
Models (LLMs) on text production and the work with LLM-texts as sources of his- 
tory. We begin with basic considerations of authorship and text before moving on to 
the topics of sources and source criticism. It is evident that AI is increasingly gaining 
ground towards a mode of co-authorship with humans, in which traditional human 
authorship is becoming less important. This poses significant challenges for source 
criticism, in part due to the lack of regulation and documentation surrounding the 
use of AI. The development of new methodological approaches, with a potential 
contribution from the Digital Humanities, could be a solution. Finally, we use dis- 
course theory to investigate the interplay between authorship, textual output, and 
reception. We also outline a future scenario in which sources are predominantly co- 
authored by humans and AI systems. This includes both the risk of a potential 
discourse loop and the opportunity for a comprehensive discourse analysis of the 
positions of LLMs in discussions. 


1 Einleitung 


Wieder einmal, so scheint es, befindet sich die Menschheit an einem Wendepunkt. 
Und wie in den letzten Jahren vermehrt, wird ihm das Potenzial zugeschrieben, die 
Zivilisation zu zerstören.' Diesmal handelt es sich um die Verheißungen von 
künstlicher Intelligenz, ein bekanntes Feld, das 2022 plötzlich erneut die Öffent- 
lichkeit in Aufruhr versetzte. Zu einem Zeitpunkt, da sich die Leistungsfähigkeit von 
Hardware mit entsprechend elaborierter Software und einem aufs schier Unend- 
liche angewachsenen Berg an Daten trafen, trat generative KI auf die öffentliche 
Bühne. Sie kann vor allem Eingaben verarbeiten, die mittlerweile multimodal sein 


Anmerkung: Dieses Abstract wurde mithilfe von ChatGPT 3.5 ins Englische übersetzt, im weiteren 
Verlauf allerdings durch das Lektorat substanziell verändert bzw. verbessert. 


1 Die multiple Krisensituation von Klima- und Biodiversitätskrise wurde noch beschwert durch 
Warnungen vor den Gefahren einer potenten künstlichen Intelligenz. Vgl. Center for AI Safety, 
„statement on AI Risk“, in [wwwsafe.ai/statement-on-ai-risk] (Zugriff: 04.10.2023). 


8 Open Access. © 2024 bei den Autorinnen und Autoren, publiziert von De Gruyter. Dieses Werk ist 
lizenziert unter einer Creative Commons Namensnennung - Nicht kommerziell - Keine Bearbeitung 4.0 International 
Lizenz. https:/doi.org/10.1515/9783111351490-032 
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können,” Bedeutungen erfassen und im entscheidenden Schritt Ausgaben dazu 
anfertigen, die im immer häufigeren besten Fall sinnvoll sind. Das disruptive Po- 
tential dieser Technologie ist immens, wenn man den zukunftsgläubigen Anhänger: 
innen folgt. Doch selbst vorsichtigere Stimmen wägen ab, wie diese KI-Systeme 
Veränderungen herbeiführen können und welche Bereiche davon betroffen sein 
mögen. 

Jedenfalls sind im Bereich der Wissenschaft Auswirkungen zu erwarten. 
Schreibprozesse, Wissensproduktion, Texterstellung, Datenverarbeitung - all diese 
Felder können von den aktuellen Anwendungen der KI-Modelle bereits mit er- 
staunlich guten Ergebnissen bearbeitet werden. Entsprechend ist auch hier eine 
betriebsame Auseinandersetzung mit dem Thema in Gang geraten: Das sind etwa 
Expertenbefragungen,° ein kollektives Thesenpapier,* oder Abhandlungen zu be- 
stimmten Aspekten.” 

Allen gleich ist die Einschätzung, dass sich einiges verändern wird und dass 
konkrete Voraussagen sehr schwierig bis problematisch sind. Die Lösung dazu war, 
sie als Spektrum oder in den zwei Extremwerten von Utopie und Dystopie abzu- 
bilden. Für unseren Aufsatz bedeutet das, dass wir aktuelle Zustände aufgreifen, 
Entwicklungen teilweise fortführen und ohne konkrete Details zu konstatieren eine 
für uns wahrscheinliche Tendenz prognostizieren. Das reicht für unsere Frage- 
stellung, was die aktuellen und womöglich zukünftigen Herausforderungen durch 
Text-KI für Quellenarbeit in der Geschichtswissenschaft sind. 

Diese Fachdisziplin hat sich intensiver als viele andere um ein etabliertes In- 
strumentarium der Quellenkritik bemüht, was über Gustav Droysens historische 
Methode bis in die griechische Antike zurückreicht. In ihrer Zugangsweise ist die 
(Text-)Quelle originäres Produkt natürlicher Personen, die einerseits Produzent: 
innen von Wissensinhalten sind, andererseits über ihre Verortung diesen Inhalten 
noch eine maßgebliche Dimension anfügen. Wenn später durch Theorien eines 
kollektivierten Wissens das Individuum als solch ein Schöpfer abgewertet wurde, 
blieb seine Bedeutung dennoch ungebrochen. Mit aktuellen Text-Kls steckt diese 


2 OpenAl, „ChatGPT Can Now See, Hear, and Speak“, 2020, in [openai.com/blog/chatgpt-can-now-see- 
hear-and-speak] (Zugriff: 04.10.2023). 

3 Benedikt Fecher et al., Friend or Foe? Exploring the Implications of Large Language Models on the 
Science System, arXiv 2023 (DOI: 10.48550/arXiv.2306.09928). 

4 Anika Limburg et al., „Zehn Thesen zur Zukunft des Schreibens in der Wissenschaft. Diskussi- 
onspapier Nr. 23 / Juni 2023“, hg. vom Hochschulforum Digitalisierung, 2023. 

5 André Leme Lopes, „Artificial History? Inquiring ChatGPT on Historiography“, Rethinking History, 
2023, 1-41 (DOI: 10.1080/13642529.2023.2234227). In ihrer Erkundung der historiographischen Fahig- 
keiten bleibt Leme Lopes im Frühjahr 2023 skeptisch, ob eine überwiegend automatisierte Ge- 
schichtsschreibung möglich sein wird, sieht aber in teilweiser Zusammenarbeit mit KI-Instanzen 
keine Probleme. 
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Prämisse der Quellenkritik jedoch einmal mehr in einer Krise. Autorschaft als 
strukturelles Analysekriterium funktioniert immer weniger, wenn das menschliche 
Individuum zunehmend auf eine Ko-Autorschaft reduziert wird, auf Prompt-Engi- 
neering oder Textredaktion. 

Wie kann aber eine zukünftige Quellenarbeit der Geschichtswissenschaft 
aussehen? Im nachfolgenden Text werden wir zuerst den Versuch einer Zu- 
standsbeschreibung geben - ein aufgrund des hochdynamischen Charakters ei- 
gentlich hoffnungsloses Unterfangen. Im weiteren Verlauf skizzieren wir die Pro- 
blemfelder Autorschaft und Text, um die Korrelationsschichten zwischen 
Autorinstanz und Inhalt herauszuarbeiten. Weiters problematisieren wir den 
Quellenbegriff und dessen Herausforderungen. Mit diesem Rüstzeug können wir zu 
guter Letzt ergründen, wie eine Zugangsweise über die methodisch-theoretischen 
Bahnen von Diskurstheorie und -analyse helfen könnte. Das reicht von Überle- 
gungen zu den Instanzen von Wissen, Macht und Praxis bis hin zur Gefahr einer 
diskursiven Schleife. In einer kurzen Skizze entwerfen wir dabei ein grobes Gerüst 
einer verstärkten Quellenkritik, die sich dezidiert der KI-Diskursposition widmet. 


2 Ausgangslage 


Eine Darlegung der aktuellen Situation rund um KI darf hier mit Rücksicht auf 
einleitende Artikel des Sammelbands entsprechend kurz geführt werden. Insgesamt 
fällt aufgrund der Dynamik des Feldes selbst eine Zustandsbeschreibung schwer. 
Neben den technischen Neuerungen sind auch die offenkundigen gesellschaftlichen 
Veränderungen hervorzuheben, die sich aus der Implementierung von Digital- 
technologie in das Berufs- und Alltagsleben ergeben. Die Willensanstrengungen, 
diese proaktiv voranzutreiben, lassen sich sehr gut in den „move fast and break 
things“-Erzählungen® rund um das Silicon Valley und die Start-up-Kultur beob- 
achten.’ Wir geben dennoch einen summarischen knappen Überblick rund um 
unsere Schwerpunktsetzung. 

Large Language Models (LLMs) sind die aktuelle Ausprägung von KI und ihren 
Narrativen, selbst ihre zugrundeliegenden Konstruktionen des machine learning 
und der neuronalen Netze entsprechen etablierter Technik.’ Entscheidend war die 


6 Steven Levy, Facebook: The inside Story, New York 2020, 241. 

7 Adrian Daub, Was das Valley denken nennt. Uber die Ideologie der Techbranche, Berlin 72021; Nils 
Güttler, „Die Wissenschaft des Bestsellers. Eine kurze Geschichte von ‚Sapiens‘“, Merkur, Bd. 882, 
2022, 50-61. 

8 Jürgen Schmidhuber, „Deep Learning in Neural Networks: An Overview“, Neural Networks, Bd. 61, 
2015, 8-117 (DOI: 10.1016/j.neunet.2014.09.003); Ian Goodfellow et al., Deep Learning, Adaptive Com- 
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Veröffentlichung des generativen Textmodells GPT3 von OpenAl in einer Version 
mit Chat-Interface am 30. November 2022.” Damit war es für jede interessierte 
Person möglich, diese Anwendung auszutesten und in die eigene Tätigkeiten zu 
integrieren. In Folge dieser Marketingaktion konnte man eine selbst für das digitale 
Zeitalter präzedenzlose Steigerung der Nutzerzahlen erleben.'° Innerhalb nur we- 
niger Monate wurden LLMs - begrifflich oft reduziert auf den Vorreiter ChatGPT 
oder einfach KI - zu einem bestimmenden Thema in der Medienlandschaft ebenso 
wie in den diversen Feldern einer möglichen Transformation: Vor allem Bereiche 
der Textproduktion wie Bildung, Journalismus, Literaturbetrieb und Schriftverkehr 
im Allgemeinen standen im Zentrum, aber auch das Programmieren mit Formal- 
sprachen. 

Die mit März nachfolgende Bezahlversion von ChatGPT (v. 4) integrierte das 
foundation model tiefer in Anwenderprozesse, indem eine Programmierschnitt- 
stelle für weiterführende Applikationen eingerichtet, die Performance weiter ver- 
bessert und eine Anzahl an Plugins direkt in die Benutzeroberfläche integriert 
wurde.'' Daneben ließ sich ein hektischer Betrieb anderer Akteure des Felds er- 
kennen, mit ihren Modellen nicht ins Hintertreffen zu geraten, was sich in Veröf- 
fentlichungen oder deren Ankündigung durch Google (Bard, Gemini), Meta (Llama), 
Anthropic (Claude) u.a. niederschlug. Das abrupte Hoch des KI-Narrativs'” wurde 
zusätzlich durch Modelle der Bildverarbeitung und -erstellung befeuert (DALL-E, 
Stable Diffusion, Midjourney, Adobe Firefly).’* Die Situation, die sich aus all dem 
ergeben hat, ist eine Diffusion der KI-Anwendungen in unterschiedliche Bereiche, 
ein Wettlauf der Anbieter um das beste Modell, eine Goldgräberstimmung unter 


putation and Machine Learning, Cambridge/Mass 2016, 1-26; Die Transformer-Architektur ist bereits 
seit 2018 die vielversprechendste für KI, vgl. Christopher D. Manning, „Human Language Under- 
standing & Reasoning“, Daedalus, Bd. 151(2), 2022, 130 (DOI: 10.1162/daed_a_01905); Leme Lopes 2023, 
1-7. 

9 Paola Lopez, „ChatGPT und der Unterschied zwischen Form und Inhalt“, Merkur, Bd. 891, 2023, 18. 
10 Eugenie Park/Risa Gelles-Watnick, „Most Americans Haven’t Used ChatGPT; Few Think It Will 
Have a Major Impact on Their Job“, Pew Research Center, 2023, in [https://tip.de/ps73c] (Zugriff: 04.10. 
2023); Der Schlüsselwert von 100 Millionen Nutzer:innen wurde in beispiellosen zwei Monaten 
erreicht, vgl. Sonya Huang/Pat Grady, „Generative Al’s Act Two“, Sequoia Capital, 2023, in [www.se 
quoiacap.com/article/generative-ai-act-two] (Zugriff: 04.10.2023). 

11 Lopez 2023, 18; OpenAl, „GPT-4“, 2023, in: [openai.com/research/gpt-4] (Zugriff: 04.10.2023); 
OpenAl, „ChatGPT - Release Notes“, in [help.openai.com/en/articles/6825453-chatgpt-release-notes] 
(Zugriff: 04.10.2023). 

12 Vgl. Stephen Cave/Kanta Dihal/Sarah Dillon (Hg.), AI Narratives: A History of Imaginative Thin- 
king about Intelligent Machines, Oxford 2020 (DOI:10.1093/0s0/9780198846666.001.0001). 

13 Multimodalität ist das aktuelle Stichwort, weshalb diverse Medien, auch Video (z. B. Runway), 
Audio (z. B. Stable Audio) und deren gleichzeitige Verarbeitung (ChatGPT Plus seit 25.09.2023) 
mittlerweile verfügbar sind. 
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den Apologeten der Tech-Kultur mitsamt der Start-up-Szene und vielfache Über- 
forderung unter den prophezeiten Betroffenen. 

Einen guten Einstieg in die Funktionsweise bietet GPT selbst: Das steht für 
Generative pre-trained Transformer und bezeichnet eine Modellarchitektur, die über 
Encodierung, Decodierung und einen dahinterliegenden Vektorraum verfügt. Pre- 
Trained bedeutet, dass der Vektorraum durch ein großes Set an vorgefertigten 
Daten in Form von deep-learning-Algorithmen trainiert wurde. Generativität be- 
zeichnet seine Fähigkeit, ohne prädeterminierte Vorgaben selbstständig Inhalte zu 
erstellen. Im Prozess des Trainings wurden große Mengen schriftlicher Inhalte für 
den Prozess des unsupervised learning bereitgestellt, woraus das Modell Muster 
abgeleitet hat.'* Multidimensionale Vektorräume zu Wahrscheinlichkeiten wurden 
von den Algorithmen aus den Daten erstellt: Welche syntaktischen Einheiten — 
Buchstaben, Wörter, Phrasen - folgen in natürlicher Sprache aufeinander? Ein 
entscheidender Schritt fand im Anschluss daran das erste Mal bei OpenAl statt: 40 
Personen bewerteten Inhalte entlang moralisch-ethischer sowie auf Faktizität ab- 
zielender Kriterien, woraus ein zusätzliches Modell gebaut wurde, das danach das 
gesamte Sprachmodell dahingehend überarbeitete. 

Das Ergebnis ist eine erstaunlich funktionsfähige Software, die Text verarbeiten 
und erstellen kann. Ihre semantischen Fertigkeiten sowie das Vorliegen eines in 
multidimensionalen Vektoren erfassten Bedeutungsmodells haben eine Diskussion 
entfacht, inwieweit hier von Intelligenz gesprochen werden kann. Die vorsichtige 
Fraktion lehnt das ab und sieht maximal Formen von „dumb meaning“. Die En- 
thusiast:innen hingegen meinen, Bewusstsein'® oder eine dem Menschen eben- 
bürtige AGI (Artificial General Intelligence) zu erkennen.'” Dabei liegen derzeit 
handfeste funktionale Problemfelder vor, die von den Entwickler:innen bearbeitet 
werden. Bekannt ist etwa das Halluzinieren, wenn falsche Information einfach aus 
den Wahrscheinlichkeiten erfunden wird. Offensichtlich gibt es hier kein Konzept 


14 Leme Lopes 2023, 11-13. 

15 Hannes Bajohr, „Dumb Meaning: Machine Learning and Artificial Semantics“, IMAGE, Bd. 37(1), 
2023b, 62 (DOI: 10.1453/1614-0885-1-2023-15452). 

16 Das sogenannte reinforcement learning from human feedback (RLHF), vgl. Lopez 2023, 18-19. 
17 Bajohr 2023b; David Hsing, „Artificial Consciousness Is Impossible“, Towards Data Science, 2021, 
in [https:/tip.de/mt3zd] (Zugriff: 04.10.2023). 

18 Ann-Kathrin Nezik, „Künstliche Intelligenz: Hast du ein Bewusstsein? Ich denke schon, antwortet 
der Rechner“, Die Zeit, 2023, in [www.zeit.de/2023/03/ki-leben-chatbot-gefuehle-bewusstsein-blake- 
lemoine] (Zugriff: 04.10.2023). 

19 Ein prototypischer Preprint: Sébastien Bubeck et al., Sparks of Artificial General Intelligence: 
Early Experiments with GPT-4, arXiv 2023 (DOI: 10.48550/arXiv.2303.12712). 
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von Wahrheit, im Gegenteil zur menschlichen Verarbeitung von Bedeutungen.” 
Kritiker:innen sprechen deshalb auch von „stochastic parrots“. 

Indem sie in verschiedene Anwendungen integriert werden, erleichtern LLMs 
die Bedienung von Software, weil sie in natürlicher Sprache bedient werden kön- 
nen. Umgekehrt ist mit dem Prompting oder Prompt Engineering — dem Erstellen 
bestmöglicher Anweisungen oder Kommandos - aber auch ein eigener Zweig an 
Literacy entstanden, der erlernt werden muss.” Dessen Wichtigkeit wird an viel- 
fachen Lernangeboten, von Büchern” bis hin zu einer großen Menge an Internet- 
angeboten ersichtlich. Daran zeigt sich weiters das Nebeneinander von kommer- 
ziellen Anbietern und der open-source-community, die versucht, mit aktuellen 
Modellen Schritt zu halten, um einerseits Monetarisierung zu verhindern, ande- 
rerseits aber auch lokale Instanzen von LLMs aus Sicherheitsgründen und für 
Personalisierung zu kreieren.”* 

Der Fokus auf professionelle Textproduktion zeitigte bereits einige Spezialan- 
wendungen, nicht nur unter den Plugins. Derart wurde in Teilen der Welt ein 
Schreibassistent in Google Docs inkludiert,”° der über formale Kriterien hinaus den 
Schreibprozess begleitet.” Ähnliches wird auch von anderen Unternehmen ange- 


20 Lopez 2023, 24. 

21 Emily M. Bender et al., „On the Dangers of Stochastic Parrots: Can Language Models Be Too Big?“, 
Proceedings of the 2021 ACM Conference on Fairness, Accountability and Transparency, FAccT ’21, 
New York 2021, 610-623 (DOI: 10.1145/3442188.3445922). 

22 Die Einschätzungen gehen zwar von abnehmender Bedeutung des modellabhängigen Promp- 
tings aus, da die Verarbeitung der Eingaben kontinuierlich besser wird, ein präzises Hinführen zum 
gewünschten Ergebnis wird dennoch Erfahrung erfordern. Noah Edelmann, „The Neuron News- 
letter“, 04.08.2023, in [https://www.theneurondaily.com/p/hot-take-prompt-engineering-overrated] 
(Zugriff: 04.10.2023): „We think prompt engineering (learning to converse with an Al) is overrated. 
Yup, we said it. We think the future of chat interfaces will be a combination of preloading context 
and then allowing AI to guide you to the information you seek.“ 

23 Alan D. Thompson, „The ChatGPT Prompt Book, Rev. 5“, LifeArchitect.ai, 2023, in [https://tip.de/ 
ge9gq] (Zugriff: 04.10.2023). 

24 Das mit Abstand bedeutendste Portal für die Community und die Modelle ist Hugging Face: 
„Hugging Face — The AI Community Building the Future“, 2023, in [huggingface.co/] (Zugriff: 04.10. 
2023); Sami Nenno, „Inside Hugging Face — Digital Society Blog“, HIIG, 2023 (DOI: 10.5281/zen- 
odo.8276981). 

25 Bard ist ein Begleiter durch die Arbeitswelt von Google (z.B. Emails, Text, Suche), wenngleich 
seine Funktionalität in ersten Tests teilweise etwas fragwürdig scheint. Vgl. ycombinator Hacker- 
news, How is Bard doing?, in [news.ycombinator.com/item?id=37564768] (Zugriff: 04.10.2023). 

26 Google, ,Announcing New Generative AI Experiences in Google Workspace“, Google Workspace 
Blog, 2023, in [workspace.google.com/blog/product-announcements/generative-ai] (Zugriff: 04.10. 
2023); Google, „Duet AI in Google Workspace. Generative AI Tools for Work“, Google Workspace, in 
[workspace.google.com/solutions/ai/] (Zugriff: 04.10.2023). 
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boten” und der Marktführer der Stand-alone-Textverarbeitungsprogramme, 
Microsoft mit Word steckt in Vorbereitungen. Deren Anreicherung des Office-Pakets 
„365“ um den „Copilot“, „[which] optimizes workflow by automating repetitive 
tasks“”®, zeigt bis hin zur Begrifflichkeit die zunehmende Zusammenarbeit mit KI- 
Instanzen. LAIKA hat sogar eine Art Sparringpartner erstellt, der an personlichem 
Text trainiert wurde.” Das ist schlussendlich nur die Weiterführung der zuneh- 
menden Personalisierung durch Nutzerprofile und Custom Prompting, wodurch die 
KI mit einem Informationsfundament und nicht jedes Mal ohne Vorwissen in die 
Konversation startet.°° Derartige Leistungsfähigkeit sowie die Perspektive, dass 
existierende funktionale Probleme bald ausgemerzt sein können, erwecken vie- 
lerorts Sorgen um den Status des Menschen und seiner geistigen Produkte wie auch 
um Überprüfbarkeit im Wissenschafts- und Bildungsbereich. Hörbar ist deshalb 
allenthalben der Ruf nach etablierten Regulierungsmechanismen. 


3 Autor 


Das wichtigste Kriterium zur Beurteilung und zum Umgang mit einem Text ist das 
der Autorschaft. In ihr treffen sich Rechte mit Pflichten: Ein:e Urheber:in eines 
Textes kann Verwertungsrechte in Form eines Copyrights geltend machen, der:die 
Autor:in muss jedoch umgekehrt auch für die darin getätigten Aussagen einstehen, 
bis hin zum Grenzfalls des Plagiats. An der Autorschaft setzt jede Form von Kritik 
und Affirmation an, was in der allgemein anerkannten Verflechtung zwischen 
Autor:in und Werk fundiert. Wenngleich berechtigte philosophisch-theoretisch 
Kritik an dieser positivistisch gefärbten Auffassung des Menschen geäußert wurde, 
sind die Implikationen gerade im rechtlichen Bereich höchst bedeutsam: Künstler: 
innen sind darauf angewiesen und das gesamte System der Wissenschaft beruht 
darauf.** 


27 Steven Van Vaerenbergh, „Awesome Generative AI“, 2023, in [github.com/steven2358/awesome- 
generative-ai] (Zugriff: 04.10.2023). In der Liste finden sich etwa ca. 20 Produkte, die (akademisches) 
Schreiben unterstützen. Das bekannteste ist wohl „Jasper“. 

28 Yusuf Mehdi, „Announcing Microsoft Copilot, Your Everyday AI Companion“, The Official 
Microsoft Blog, 2023, in [https://tip.de/gpe4w] (Zugriff: 04.10.2023). 

29 LAIKA, „Write with LAIKA - Personalised Artificial Intelligence for Writers“, in [www.writewith 
laika.com] (Zugriff: 04.10.2023). 

30 OpenAl, „Custom Instructions for ChatGPT“, OpenAI Blog, 2023, in [openai.com/blog/custom-in- 
structions-for-chatgpt] (Zugriff: 04.10.2023). 

31 Doris Weßels et al., Verlässliche Wissenschaft: Bedingungen, Analysen, Reflexionen, Darmstadt 
2022, 5-6. 
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Kritik kommt vor allem aus (post)strukturalistischer Richtung. Am prägnan- 
testen wurde sie 1967 von Roland Barthes in den Slogan vom „Tod des Autors“ 
gefasst: Vom Standpunkt der Intertextualitätstheorie ist jedes Werk, egal ob in äs- 
thetischer oder inhaltlicher Form, Teil einer langen Verweiskette, die es an viele 
Vorgänger anbindet. Autor:innen sind demnach grundsätzlich in einem dichten 
Geflecht von Texten und deren Bedeutungen verfangen, weshalb sie weit abrücken 
von einem produktiven Genie und Einzeltäter:innen. Konsequenterweise verlagern 
Barthes und die französischen Poststrukturalist:innen den Schwerpunkt im Sinn- 
bildungsprozess hin zum Text und den Rezipient:innen, die den Text „mitschaffen“. 
Die Erstellung des Textes reduziert sich auf eine Re-Artikulation kollektiver Be- 
deutungen, was auch eine sehr treffende Zuschreibung für LLMs und deren Au- 
torposition ist. Eine intertextuelle Analyse kann die symbolischen Referenzen er- 
kennen und ausweisen, wodurch sich ein Werk genauso wie ein:e Autorin im 
Geflecht der Bedeutungen verorten lässt.” 

Ein weiteres Argument zur Entwertung der Autorposition stützt sich auf die 
Verflechtung der Semantik mit der sozialen Ebene. Die Diskurstheorie regelt Sag- 
barkeiten für die mit einem Diskurs verbundenen und darin verhafteten Personen. 
Demnach hat eine Person nie völlige Freiheit alles zu sagen und selbst zu denken, 
sondern bewegt sich in Bahnen, die von Macht- und Wissensstrukturen eingeengt 
sind. Je nach Diskursposition ist eine unterschiedliche Einwirkung auf diese mög- 
lich, die Veränderung eines Diskurs ist jedoch nur für äußerst mächtige Einzelpo- 
sitionen denkbar. Entsprechend ist auch über diesen Zugang keine völlige Freiheit 
in der Aussage möglich und Autorinnen sind ganz im Gegenteil ständig in einem 
Korsett des Sagbaren und Nicht-Sagbaren gefangen. 

Diese Kritik ist im Feld der Geisteswissenschaften breit akzeptiert und aner- 
kannt, kann aber aus pragmatischen Gründen im Bereich der Rechtswahrnehmung 
nur bedingt angewandt werden. Grenzfälle aus Urheberrechtsprozessen°* zeigen 
das, wenngleich in wissenschaftlicher Verantwortungsübernahme der Rahmen 
enger gezogen wird.’ Mit dem Einsatz von LLMs verändert sich die gesamte Fra- 
gestellung, denn der Autorenbegriff wird damit technisch und theoretisch eindeutig 


32 Roland Barthes, „Der Tod des Autors“, in Texte zur Theorie der Autorschaft, hg. von Fotis Jan- 
nidis, Stuttgart 2000, 185-197. 

33 Dirk Quadflieg, „Roland Barthes: Mythologe der Massenkultur und Argonaut der Semiologie“, in 
Kultur — Theorien der Gegenwart, hg. von Stephan Moebius/Dirk Quadflieg, Wiesbaden ?2011, 27-30. 
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Inspiration and Infringement“, Communications Lawyer: Publication of the Forum Committee on 
Communications Law, American Bar Association, Bd. 31(3), 2015, 10-13. 

35 Das Plagiat ist ein schweres Vergehen, wohingegen diese korrekt zitierte Übernahme von In- 
halten ohne eigene Zusatzleistung einfach nur wertlose wissenschaftliche Leistung darstellt. 
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diffuser.** Es gibt bereits erste Entscheide gegen Copyright auf KI-erstellte Inhalte?” 
und Verlage bzw. Redaktionsleitungen haben gegen die Nennung von LLMs als 
Autor:innen votiert.*® 

Wenn traditionellerweise ein Text als Einzelleistung gesehen wird, dann sind 
lang etablierte Hilfsmechanismen und Unterstützungsformen nicht berücksichtigt. 
Menschliche Zuarbeit in Form von Lektorat bis Korrektorat fallen ebenso darunter 
wie gegenwärtig gängige technische Unterstützung durch Rechtschreibprüfungen. 
Was zum Beispiel im Verlagswesen oftmals unter Hilfstätigkeit eingereiht wird, 
kann mitunter entscheidend auf die Produkte einwirken.” In dem Sinne ist die 
Verwendung von LLMs nur ein logischer nächster Schritt.” Entscheidend ist die 
Tiefe der Integration in den menschlichen Schaffensprozess, denn auch hier gibt es 
ein Spektrum, das von kompletter, wenn nicht sogar automatisierter Ausformulie- 
rung entlang von Prompts bis hin zu simpler Endpolitur eines Textes hinsichtlich 
Formalkriterien und Ausdruck reicht. Am ehesten lässt sich diese Diversität an 
Möglichkeiten noch unter dem Sammelbegriff der Ko-Autorschaft fassen. Ihr 
Spektrum beginnt bereits in der Ebene der Textformalia und reicht bis zum Ex- 
tremwert der Texterstellung. Selbst diese kann jedoch maximal semi-automatisch 
sein, da den Beginn immer ein Prompt ausmachen muss. Ein menschlicher Rest ist 
also in Form der Intentionalität in der Autorschaft stets enthalten.“ 

Welche Form von Autorschaft liegt nun bei einem LLM vor? In seiner Form als 
probabilistische Wiedergabe von bereits verfasstem Textmaterial ist es weit stärker 
in Intertextualität verstrickt, als es der Mensch sein kann.” Welche Daten im 
Trainingsprogramm enthalten sind, wird ebenso von den Entwicklern entschieden, 
wie die übergeordnete ethisch-moralische Modellebene. Das enthaltene Bias ist 


36 Limburg et al. 2023, 5-8. 

37 Wes Davis, „Al-Generated Art Cannot Be Copyrighted, Rules a US Federal Judge“, The Verge, 2023, 
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prove“, Nature, Bd. 613, 2023, 620-21 (DOI: 10.1038/d41586-023-00107-z); Nature Editorial, „Tools Such 
as ChatGPT Threaten Transparent Science; Here Are Our Ground Rules for Their Use“, Nature, 
Bd. 613, 2023, 612. 

39 Ein Blick hinter die Kulissen des Kulturbetriebs etwa zeigt oftmals Zusammenarbeit, die das 
Endprodukt entscheidend mitgeprägt hat. Im Wissenschaftsbetrieb könnten wohl viele Dissertant: 
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gefunden hat. 

40 Axel Springer hat etwa eine eigene Abteilung geschaffen, die sich mit den Fragen nach Inte- 
gration und Richtlinien beschäftigt. Vgl. Axel Springer, „Axel Springer Establishes Global Generative 
AI Team“, 2023, in [https:/tip.de/07531] (Zugriff: 04.10.2023). 

41 Limburg et al. 2023, 8-10. 
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werden, was bereits in den Daten vorliegt. Vgl. Bender et al. 2021. 
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insofern eine Mischung aus zufälligen und bewussten, kollektiv und individuell 
gefärbten Prägungen des jeweiligen Modells. Die menschlichen Entwickler- und 
Entscheidungsinstanzen weisen jedoch Verantwortung von sich, da sie dem Modell 
funktionale Unabhängigkeit zuweisen. Die rechtliche Praxis hat sich auf einen 
ähnlichen Weg begeben, indem die Haftung auf die Nutzer:innen von LLMs zu- 
rückgeführt wird. Frühe Beispiele der Mitautorschaft an einem Paper etwa wurden 
von Editorial Boards etablierter publizistischer Organe sehr schnell unterbunden.” 

Diese Vorstöße geben jedoch keine Antwort darauf, wie der zukünftige Umgang 
mit LLMs im Bereich der Textproduktion gesellschaftlich geregelt werden soll. 
Welche Autorschaft liegt vor? Welchen Anteil hat ein LLM? Wieweit soll das do- 
kumentiert werden? Überprüfen lässt es sich nicht, denn Werkzeuge der Über- 
prüfung auf KI-Anteile sind bereits vor Einführung als gescheiterter Versuch an- 
zusehen.” Eine Dokumentation der Ko-Autorschaft scheint nicht nur hinsichtlich 
der guten wissenschaftlichen Praxis nötig: „Its becoming increasingly difficult to 
gauge what’s AI and we believe media outlets should be completely transparent 
about their AI use.“*° 

Ein weiterer Punkt betrifft den Einsatz bewusster Farbung von Texten. Mit 
Custom Prompting oder speziell trainierten LLM-Instanzen können Texte erstellt 
werden, die einen Stil oder Inhalte imitieren. Ein Anbieter hat dieses Potenzial 
erkannt: „LAIKA trains an artificial intelligence on your own writing to create a 
personalised creative partner-in-crime.“*® Die Mittel zur Nachahmung von Text- 
charakteristika liegen bereit, was die quellenkritische Ermittlung der Autorschaft 
verunmöglichen dürfte (vgl. Abschnitt 5). 

In einem ersten Zwischenfazit zu einem vieldiskutierten Thema sehen wir in 
LLMs keine Agency. Sie haben keine Intelligenz im Sinne der menschlichen und 
verarbeiten maximal etwas, das als „dumb meaning“” bezeichnet werden kann. 
Mitverantwortlich für gegenteilige Einschätzungen sind auch diskursive Prägungen 
durch personalisierte, vermenschlichte Darstellungen.” Obwohl sie immer höhere 
Grade an Autonomie erreichen, besitzen sie keine Intentionalität und können 
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44 Nature Editorial 2023. 
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deshalb auch keine Verantwortung über ihre Produkte übernehmen.” Sie bleiben 
weiterhin Werkzeuge, weshalb es stark darauf ankommt, wie die menschlichen 
Anwender:innen sie einsetzen.° Mit Ko-Autorschaft lässt sich jedoch einfangen, 
dass dieses Werkzeug nachhaltig auf den Inhalt einwirken kann. Wenn ein Text 
quellenkritisch betrachtet werden soll, dann sind Fragen nach dem Anteil des LLMs 
inklusive dessen Bias unabdingbar. 


4 Text 


Unser Zugang setzt sich entsprechend des Tagungsthemas speziell mit Text-KI und 
deren Erzeugnissen auseinander. Im Fokus stehen Texte, die durch Prompting sowie 
in Anwendung eines LLM erstellt wurden und deshalb stets eine Zusammenarbeit 
menschlicher mit algorithmischen Instanzen bedeutet. Wir bewegen uns damit 
insgesamt in einem Verhältnis aus Autorschaft — Textprodukt - Rezeption, wovon 
wir nun den Status und die Charakteristik des konkret vorliegenden Produkts aus 
der Interaktion mit LLMs diskutieren. 

Der Impact von LLMs wird je nach Textgattung und Anwendungsbereich ver- 
schieden gesehen. Mitunter überwiegen die positiven Ansichten, wenn etwa die 
Textverarbeitung für Geschäfts- oder Behördenbriefe verbessert und erleichtert 
werden kann. Auch für den Wissenschaftsbetrieb ist der aktuell vorherrschende 
Tenor vorsichtig positiv.°' Gleichzeitig gibt es Befürchtungen für den Bereich der 
Cyberkriminalität und den Mediensektor,” wonach das Halluzinieren der Modelle 
wie auch der menschliche Einsatz unter manipulativer Absicht verfälschende In- 
halte befördert. Noch drastischer wird von vielen Vertreter:innen die Auswirkung 
auf kreatives Schaffen und den Literaturbetrieb gesehen, wie etwa das Beispiel 
streikender Drehbuchautor:innen in Hollywood deutlich macht.” Im Fall der Ge- 
schichtswissenschaften ist der Output natürlich in überwiegendem Ausmaß wei- 
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terhin textlich, weshalb die Akademia sicherlich gefordert ist, einen verantwor- 
tungsbewussten Umgang mit LLMs zu finden.°* 

Wenn es jedoch um zukünftige Forschung geht, kommt vonseiten der Quellen 
eine Herausforderung auf die Geschichtswissenschaft zu: Texte und schlussendlich 
Quellen, die zu einem unbestimmbaren Ausmaß  Text-KI als Autorin aufweisen. Die 
unterschiedlichen Größenordnungen lassen sich am besten als ein Spektrum von 
minimaler Assistenz bis hin zu semiautomatisierter Erstellung von Texten durch die 
KI vorstellen. Da sich durch Text-KI und vor allem LLMs der Wirkungsanteil bis hin 
zu fast automatischer Textproduktion verschiebt, kann dementsprechend nicht 
mehr von einer einzigen Urheberschaft ausgegangen werden. Wiewohl mit Ghost- 
writing und Plagiieren bereits Mischformen bekannt sind, ist die vorgestellte Si- 
tuation doch anders. Nunmehr sind Quellen oder ganze daraus erstellte Korpora 
denkbar, die einen Anteil von Inhalten umfassen, die nicht die Position der Autor: 
innen wiedergeben. Vielmehr bestehen sie zusätzlich aus den Wahrscheinlichkeiten 
des Modells sowie dessen aus der Programmierstruktur, den Daten und dort ent- 
haltenen Vorannahmen. 

Was bereits in der Kritik an Autorschaft durch (Post-)Strukturalismus formu- 
liert wurde, gilt analog dazu für den verfassten Text. Dieser ist auch nicht als all- 
einstehendes Ergebnis zu sehen, sondern liegt, seiner Eigenständigkeit beraubt, in 
einer langen Verweiskette vor. Weiters operiert die Diskurstheorie sehr stark mit 
Sprache und ihren textlichen Fixierungen, weshalb sich ihr Textverständnis ideal 
anwenden lässt. Der Diskurs umfasst demnach jeweils einen zwar wandelbaren, 
aber mit Macht durchwirkten und deshalb kurzfristig relativ statischen Bestand an 
aktuellen Wahrheiten. Jeder Text ist somit ein Produkt des Diskurses bzw. der 
Diskurse, in dem der:die Autor:in zu einem Zeitpunkt verhaftet ist. An diese theo- 
retischen Positionen schließen die aktuellen Entwicklungen an: Das Textprodukt 
selbst wird zusätzlich durch die Verwendung von LLMs weiter seiner Einzigartig- 
keit entledigt. Der Erstellungsprozess über Wahrscheinlichkeiten verschiebt durch 
seine Funktionsweise das Ergebnis grundsätzlich in Richtung einer Summe anderer 
Texte. Über die Muster von Sagbarkeiten und moralisch-ethischen Verhaltensko- 
dizes ist schlussendlich auch eine klar diskursiv geprägte Dimension in den Text 
integriert. 

Was übrig und schwierig bleibt, ist eine Einschätzung des Textes nach dem 
Verhältnis der Autorschaften. Dem entgegenkommend haben LLM-Texte tatsächlich 
Eigenheiten, die vor allem aus ihrem statistischen Zugang resultieren. Stilistisch 
ergibt sich daraus eine Tendenz zu lexikalischer und syntaktischer Vereinfa- 
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chung.” Detektionssoftware wollte sich genau diese Muster zunutze machen, die 
Entwickler:innen mussten jedoch erkennen, dass daraus keine sichere Ableitung 
möglich ist, denn durch geschickte Manipulationen lassen sich andere Muster 
einbauen und Texte verändern.” Umgekehrt können auch Menschen über einen 
geringen aktiven Wortschatz aus Wörtern mit höherer Benutzungswahrschein- 
lichkeit verfügen. Ihre Muster ähneln fälschlicherweise denen der KI.” Diese Pro- 
bleme, inklusive der Undurchschaubarkeit der blackboxartigen Funktionsweise der 
LLMs, verunmöglichen die Isolierung von KI-Anteilen in konkreten Texten. Einen 
möglicherweise dennoch gangbaren Weg zeigen wir in Kap. 7 auf. 

Für unser beschworenes Zukunftsszenario bedeutet all das jedenfalls eine 
bunte Landschaft unterschiedlicher Nutzung von LLMs und deshalb ein ganzes 
Spektrum daraus entstehender Texte gemischten Ursprungs. Wie in Kap. 5 darge- 
stellt, kann jeglicher Text (sowie andere Medien) als Quelle funktionalisiert werden, 
weshalb auch das gesamte Spektrum in Betracht gezogen werden muss. Die je- 
weilige Anwendung von LLMs genauso wie der forschende Umgang damit mag 
vielleicht der von Lopez formulierten Frage folgen: „Was möchten wir in einer 
bestimmten Situation eigentlich von einem Text?“ Je nachdem ist vielfältige In- 
teraktion und Zusammenarbeit mit LLMs vorstellbar. Einerseits gibt es Gattungen 
und Bereiche, wo ihre Verwendung durch ethische-berufliche Codes eingeschränkt 
wird, wie im Wissenschaftsbetrieb und dem Journalismus,” andererseits mag eine 
durch sie erleichterte Textproduktion womöglich die Ansprüche an Texte und ihre 
Gattungen selbst verändern. Derart fragt sich, ob das Wissen um eine KI-Mitarbeit 
Textrezeption verändert.‘ Im Sinne der Rezeptionsästhetik ist eher denkbar, dass 
die Autorschaft gegenüber dem Inhalt selbst an Bedeutung verliert.” 
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Liegt einer forschenden Person ein Korpus von Texten vor, die potenziell mit 
Hilfe von LLMs erstellt wurden, so gilt es jedenfalls darauf zu reagieren. Fragen zur 
Art der Integration, dem verwendeten Modell, dessen Spezifikationen, den kon- 
kreten Prompts, dem Überarbeitungszustand, usw. - schlussendlich der konkreten 
Zusammenarbeit mit welchem konkreten Werkzeug sind entscheidend. Sie führen 
dennoch völlig in die Irre, wenn keine Dokumentation vorliegt. Eine umfassende 
solche nach einem etablierten Standard ist noch nicht erkennbar,” kann aber nur 
von Enthusiast:innen oder Professionist:innen wie etwa aus dem akademischen 
Bereich erwartet werden. Große Mengen zukünftigen Quellenmaterials hingegen 
werden diese Dokumentation vermutlich nicht inkludieren und auch die Verwen- 
dung eines LLM oftmals verschweigen, weshalb klassische Aspekte der Quellen- 
kritik nicht durchführbar sein werden. 

Abseits der Textlichkeit soll an dieser Stelle auch auf die bereits bekannten 
alternativen Medienprodukte verwiesen werden, die mithilfe derselben Transfor- 
mer-Architektur bereits jetzt teils erstaunlich gute Ergebnisse liefern. So sind ba- 
sierend auf den semantisch-syntaktischen Wahrscheinlichkeitsmatrizen der LLMs 
weitere Ebenen angehängt: für die sinnhafte Bilddarstellung textlicher Inhalte, für 
akustische Umsetzung usw. Im Zentrum der Funktionsweise stehen weiterhin 
komplexe Matrizen der Textverarbeitung, sie ermöglichen nun jedoch, Texteinga- 
ben in Bildmaterial oder täuschend echte Sprachspuren zu verwandeln.” Diese 
nahverwandten Quellengattungen spielen eine bedeutende Rolle für die Ge- 
schichtswissenschaft, weshalb für sie in Zeiten von born-digital-Quellen mit ähn- 
lichen Problemlagen und Herausforderungen gerechnet werden muss. 


5 Quelle 


Geschichte ist zunächst eine Erzählung, die einen zeitlichen Zusammenhang von 
Vergangenheit und Gegenwart konstruiert.™ Im Folgenden soll es aber nicht um 
Geschichte im Allgemeinen sondern um Geschichtswissenschaft gehen; daher um 
eine konstruierte, intersubjektive Narration, die mittels einer methodischen Aus- 
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wertung und Interpretation von Quellen und Darstellungen, unter Verknüpfung der 
drei Zeitebenen Vergangenheit, Gegenwart und Zukunft erstellt wird, um Sinn für 
sich selbst und andere zu bilden.“ Einfacher formuliert: die narrative Konstruktion 
der Vergangenheit aus der Gegenwart. Da die Vergangenheit nicht mehr zu- 
gänglich ist, benötigt die Geschichtswissenschaft Bindeglieder zur Vergangenheit, 
diese liegen in Form von Quellen vor. Bei Quellen handelt es sich um Medien,” von 
schriftlichen, dinglichen, baulichen, visuellen bis hin zu digitalen Phänomenen - 
um ein paar gängige Differenzierungen aufzulisten — die zum Gegenstand histori- 
scher Forschung werden.” Für die Auswirkung von Text-KIs auf Quellenarbeit muss 
deshalb auch von einem sehr breiten Quellenbegriff gesprochen werden. Jede Form 
von Textlichkeit kann theoretisch für die Forschung interessant sein und jedes Mal 
kann KI involviert sein. 

Quellen sprechen niemals fiir sich, da sie zwar die Grundlage fiir unser Wissen 
über die Vergangenheit, nicht jedoch dieses Wissen selbst sind. Anders formuliert 
haben wir es nicht „mit objektiven Tatsachen, sondern immer nur mit Auffassungen 
von solchen zu tun“‘®. Deshalb müssen Quellen mittels theoriegeleiteter wissen- 
schaftlicher Methoden ausgewertet werden, sowohl auf Ebene der Betrachtung der 
einzelnen Quelle als auch auf Ebene des gesamten Forschungsansatzes. Da diese 
Ebenen jedoch in einem dialektischen Verhältnis zueinanderstehen, kann es keine 
objektive Auswertung einer Quelle und damit auch keine objektive Historiographie 
geben. Erst durch historische Sinnbildung,”° d.h. die Einordnung jener Ergebnisse 
anhand von Deutungsmustern, kann eine Narration entstehen.” Diese Deutungs- 
muster sind subjektiv unterschiedlich und variieren individuell aufgrund einer 
Vielzahl an Faktoren, wie beispielsweise Sozialisation und Standortgebundenheit. 
Des Weiteren entsteht Geschichte immer aus Orientierungsbedürfnissen der Ge- 
genwart heraus, die sich natürlich mit der Zeit verandern.” Etwas poetischer for- 
muliert: „Es gibt Wissenschaften, denen ewige Jugendlichkeit beschieden ist, und 
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das sind alle historischen Disziplinen, alle die, denen der ewig fortschreitende Fluss 
der Kultur stets neue Problemstellungen zuführt.“”® 

Daher ist nicht bloß Quellenkritik, sondern auch Methodenkritik gefordert,”* 
um geschichtswissenschaftliche Erkenntnisse intersubjektiv nachvollziehbar zu 
machen.” Aus unserer Sicht ist eine allgemeine Quellenkritik damit nicht obsolet, 
sondern sinnvoll, solange ihr eine Methodenkritik folgt. Deshalb widmen wir uns 
zuerst der Quellenkritik und skizzieren in Abschnitt 6 einen methodischen Ansatz. 

Quellenkritik wird häufig in äußere, die sich mit der Beschaffenheit der Quelle 
befasst und innere, die die Plausibilität des Inhalts in sich prüft, unterteilt.’° Teil der 
äußeren Quellenkritik sind sowohl die Prüfung der Echtheit als auch die Prüfung 
der Chronologie. Erstere vergleicht die in der Quelle getätigten Positionen des:der 
Verfassers:in mit anderen von dieser:diesem verfassten Texten und überprüft äu- 
ßere Merkmale der Quelle wie beispielsweise die chemische Zusammensetzung 
bestimmter Arten von Tinte. Zweitere ordnet die Quelle in einen historischen 
Kontext ein, um zu bestimmen, ob sie richtig datiert ist, wobei andere Quellen, 
erwähnte Ereignisse oder auch das Medium selbst als zeitliche Referenzpunkte 
herangezogen werden.” Im Zuge der anschließenden inneren Quellenkritik wird 
kritisch beurteilt, ob die Aussagen der Quelle in Einklang mit den Naturgesetzen 
stehen, logisch widerspruchsfrei sind und auf welchen Grundlagen bestimmte 
Aussagen getätigt werden, beispielsweise bei Statistiken eine Überprüfung der Er- 
hebungsgrundlage. Außerdem wird die Perspektivität der Quelle reflektiert und 
gegebenenfalls mit Perspektiven anderer Quellen verglichen. So kann zum Beispiel 
die Berichterstattung unterschiedlicher Zeitungen zu einem Ereignis untersucht 
werden.”® 

KI-generierte Texte verändern diese Anforderungen bzw. die Aspekte einer 
solchen Quellenkritik. Aussagekräftiges Beispiel dieser Überlegung ist etwa das 
Panel „Herausforderungen von (digitaler) Überlieferungsbildung und Faktizität“ am 
Historikertag 2023.’ Wir stellen uns nun die Frage, wie eine Quellenkritik im Jahre 
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2043 erfolgen könnte - unter der Prämisse, dass bis dahin der Großteil der ver- 
fassten Texte in unterschiedlichem Ausmaß mit Hilfe von KI erstellt wurden.*° 

Die Frage nach der Autorschaft oder der Richtigkeit des:der zugeschriebenen 
Verfassers:in stellt sich im Zuge der äußeren Quellenkritik in anderer Form als 
bisher. Es gilt nicht ausschließlich, den:die Autor:in zu ermitteln, sondern auch, ob 
und in welchem Ausmaß welche KI am Werk war. Eine Option dazu wäre die 
Verwendung von Watermarks, also statistische Markierungen, die beim Generieren 
des Textes in diesen eingebaut werden und von anderen KIs erkannt werden 
können. Diese Prüfzeichen funktionieren zwar sehr gut,” allerdings ist man dabei 
auf den „Goodwill“ der Unternehmen angewiesen, die textgenerative KI anbieten. 
Außerdem können sie durch das Umschreiben eines KI-generierten Textes in eigene 
Worte umgangen werden. Insofern stellen sie keine ausnahmslos zuverlässige 
Methode zur Prüfung der Autorschaft dar. Nichtsdestotrotz werden sie als Mittel zur 
Regulierung von KI in China und den USA in Betracht gezogen.*” 

Es gibt zwar auch die Möglichkeit, Texte ohne Watermarks auf KI-Einsatz zu 
überprüfen, jedoch sind diese sehr begrenzt in ihrer Effektivität - mittlerweile 
wurden Tools wieder zurückgezogen oder eingestellt, da sie nicht funktionieren, 
selbst biased sind und leicht umgangen werden können. So diskriminieren sie 
beispielsweise nicht-muttersprachliche Personen, indem sie sie für KIs halten, oder 
können getäuscht werden, indem ein KI-generierter Text nochmals von derselben 
KI überarbeitet wird.°® Hinsichtlich der Prüfung der Echtheit des:der Autors:in sei 
außerdem noch angemerkt, dass mithilfe von KI, die mit geeigneten Probesamples 
Schreibstile imitiert, (vgl. z.B. CharacterAl) Fälschungen mit einem ungleich ge- 
ringeren Zeitaufwand produzierbar sind. Das inkludiert vielfältige weiterführende 
Probleme der äußeren wie inneren Quellenkritik sowie der gesamten wissen- 
schaftlichen Praxis.** Eine weitere Form der Irreführung, die für den Wissen- 
schaftsbetrieb zudem hoch problematisch ist, betrifft das beschriebene Halluzi- 
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nieren. Derartige erfundene Fakten lassen sich zwar mitunter leichter erkennen, 
untergraben jedoch die Autorität von Autorschaft weiter. Ihr Auftreten bei KI-Ko- 
Autorschaft sollte beim kritischen Prüfen des Inhalts einer Quelle auf seine Plau- 
sibilität stets mitbedacht werden. 

Des Weiteren ist auch die Überprüfung von Text(-stellen), die einer bestimmten 
KI bzw. KI-Version zugeschrieben werden, im besten Falle äußerst schwierig. Es gibt 
schlichtweg keine Offenlegung, Dokumentation und Archivierung von KI-Versionen. 
Dass private Firmen wie OpenAl, deren Geschäftsmodell auf der Monetarisierung von 
Software basiert, detaillierte Informationen zu KI-Versionen und deren Veränderung 
verlässlich der Öffentlichkeit zur Verfügung stellen, bleibt unwahrscheinlich. Auß- 
erdem können KIs schon allein wegen ihrer inhärenten Unschärfefunktion nicht 
wiederholt die gleiche Antwort liefern. Zuletzt müssen selbst Formen der Ko-Autor- 
schaft wie Custom Instructions®’mitbedacht werden. De facto erscheint uns daher 
diese quellenkritische Überprüfung unmöglich. 

Aufgrund genannter Schwierigkeiten drängt sich der Gedanke auf, dass analog 
zu etablierten historischen, speziell quellenkritischen Hilfswissenschaften, die sich 
mit bestimmten Quellentypen auseinandersetzen, eine eigene Hilfswissenschaft für 
Quellen mit KI-Ko-Autorschaft entstehen könnte. Gerade die Digital Humanities 
bieten aufgrund ihrer Verortung an der Schnittstelle von Geisteswissenschaft und 
IT-Anwendungen eine Disposition für die Entwicklung einer solchen Disziplin, die in 
diesem Zukunftsszenario geradezu notwendig werden könnte. 

Zusammenfassend lässt sich konstatieren, dass die Überprüfung eines Textes 
auf KI-Anteile hin aus aktueller Sicht praktisch unmöglich ist und man deshalb stets 
von einem „Mensch-KI-Text“ ausgehen muss. Dies muss auch im Zuge der inneren 
Quellenkritik bei der Reflexion der Perspektivität der Quelle mitbedacht werden. 
Wenn Kl als Ko-Autorin fungiert, ist es schwieriger, die Perspektive des:der Autor:in 
zu ermitteln. Eine bestimmte KI-Perspektive kann sich schlussendlich sogar in 
vielen Quellen niederschlagen und damit ganze Diskurse beeinflussen. 


6 Zukunftsszenarien - Zugänge zur 
LLM-Diskursposition 


Bedeutende und etablierte Auffassungen von Autorschaft, Text und Quelle stehen 
mit den Entwicklungen um Text-KI vor der Gefahr, sich zu verschieben oder zu 
verschwinden. Diese Gestaltwandlung betrifft alle drei Bereiche der Triade von 
Autorschaft — Textprodukt — Rezeption, jedoch unterschiedlich, je nachdem, wel- 
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ches Feld der Textproduktion betrachtet wird. In unserem Fall liegt der Fokus auf 
der Geschichtswissenschaft mit ihrer Kompetenz in der Bewertung und Auswer- 
tung textlicher Quellen. Die Herausforderungen, die sich fiir sie ergeben, wurden 
bereits in den vorangehenden Abschnitten skizziert. Im Folgenden diskutieren wir, 
wie deren Bewältigung mithilfe der Diskurstheorie aussehen könnte. Für unser 
Szenario bilden Foucaults Diskurstheorie und die Kritische Diskursanalyse nach 
Jäger die Grundlage. Dennoch lassen sich Analyseaspekte, die wir im Folgenden 
ausformulieren, problemlos auf viele andere Zugänge aus dem breiten Feld der 
Diskurstheorie übertragen. 

Bei Diskursen handelt es sich um institutionalisierte, geregelte Redeweisen, die 
spezifische Sagbarkeits- und Wissensräume sowie deren Grenzen festlegen. Sie 
konstituieren dadurch sowohl Objektivitäten wie Begriffe und Klassifikationen, als 
auch Subjektivitäten, beispielsweise legitime Sprecherpositionen oder einen be- 
stimmten Habitus." Innerhalb der Sagbarkeits- und Wissensräume kann stets nur 
eine begrenzte Menge von Aussagen getätigt werden oder, wie Foucault es aus- 
drückt: „im Wahren ist [...], wenn man den Regeln einer diskursiven ‚Polizei‘ ge- 
horcht.“*’ Daher regulieren Diskurse das „was sagbar ist, was gesagt werden muss 
und was nicht gesagt werden kann.“ Diskurstheorien beschreiben sowohl die 
Organisation als auch die Produktion von Wissen über die Zeit — da Diskurse dy- 
namisch sind und stetigen Veränderungen unterliegen.°” 

Foucaults Diskursbegriff wird zu keinem Zeitpunkt definitorisch präzisiert und 
veränderte sich über sein Schaffen hinweg.” Wir bedienen uns an dieser Stelle vor 
allem der Kritischen Diskursanalyse, die über ein geeignetes Begriffsinventarium 
verfügt, um im Sinne der theoretischen Plausibilität nachvollziehbar zu sein. Die 
Kritische Diskursanalyse untersucht Diskurse auf Aussagenmuster hin. Aussagen 
sind als „Atome des Diskurses“”' zu verstehen, als kleinster inhaltlicher gemein- 
samer Nenner, sie konstituieren Diskurse und sind — wie die Atome in einem Mo- 
lekül - durch ihr wiederholtes Auftreten gekennzeichnet.” Aussagen lassen sich in 
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Diskursfragmenten finden, womit Textteile, selten ganze Texte,” bezeichnet wer- 
den, die sich auf ein Thema beziehen.” Diese konstituieren in ihrer Gesamtheit 
einen Diskurs, der über die Zeit betrachtet als Diskursstrang bezeichnet wird.” 

Im theoretischen Rahmen der Kritischen Diskursanalyse kann LLMs, aufgrund 
deren inhärenten Bias, eine Diskursposition, also ein politischer oder ideologischer 
Standpunkt, von dem aus gesprochen wird, zugeordnet werden.’® Sowohl die Dis- 
kurspositionen als auch die produzierten Aussagemuster können sich jedoch be- 
ständig verändern, weil die Modelle nicht statisch sind.” Da es derzeit keine Do- 
kumentationsstandards gibt, wissen die Endanwender:innen ebenso wie Expert: 
innen de facto nicht Bescheid um die Entwicklung und den Versionsverlauf der 
Modelle. Größere Versionsupdates werden klar kommuniziert, was jedoch darunter 
passiert, bleibt im Dunkeln. Mehr noch, selbst den Entwickler:innen ist vielfach 
nicht klar, wie die konkrete Funktionsweise und damit auch das Auftauchen be- 
stimmter Inhalte an bestimmten Stellen zustande kommt.” Zusätzlich dazu wird 
mit der eingebauten statistischen Unschärfe - kein Prompt liefert zweimal dasselbe 
Ergebnis - Wiederholung und Gleichförmigkeit der Aussage verunmöglicht. Zuletzt 
ist auch in der oligopolistischen LLM-Welt nicht ein Bias des einen Modells eine 
Diskursposition, sondern es muss vielmehr von einer Sammelposition aus allen 
vorherrschenden Modellen ausgegangen werden. Aufgrund ähnlicher Trainings- 
daten sollte diese aber zumindest aktuell relativ einheitlich aussehen. 

Derart kann eine Diskursposition einerseits aus inhaltlichen Neigungen be- 
stehen, die das Modell im Training aus den Daten abgeleitet hat, andererseits aber 
auch aus dem speziellen Bereich der Wertvorstellungen, die ihm eingeschrieben 
wurden, um als technischer Akteur auch Sozialität und Rücksichtnahme ausüben zu 
können. So wurde für ChatGPT ein Feedbackmodell auf Basis der moralisch-ethi- 
schen Entscheidungen von 40 Personen erstellt. Mit diesen Wahrscheinlichkeiten 
wurde das gesamte Sprachmodell einem Feintuning entlang von Moral und Fakti- 
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zität unterzogen.” An dieser Stelle sei angemerkt, dass es aus zweierlei Gründen 
keine objektive oder neutrale kiinstliche Intelligenz geben kann: Erstens sind die 
Datengrundlagen menschengemacht und menschenkuratiert, also biased. Zweitens 
stellen Versuche, diesem Bias entgegenzuwirken, indem Input oder Output veran- 
dert werden, wiederum eine Korrektur aufgrund von Werten und Normen dar.” 

Eine weitere Besonderheit der LLMs ist — aufgrund ihrer Wirkweise als 
„stochastic parrots“ — ihre Fähigkeit, zu beinahe allen Diskursen beitragen zu 
können. Voraussetzung dafür ist erstens, dass entsprechende Datengrundlagen 
bestehen, sei es auf der Basis von Trainingsdaten oder über Plugins, die Schnitt- 
stellen zu anderen Datenkorpora wie beispielsweise dem World Wide Web bieten; 
sowie zweitens, dass keinerlei modellimmanente Restriktionen vorliegen, bei- 
spielhaft hierfür wäre die Weigerung von ChatGPT 3.5, über den Bau von gefährli- 
chen Waffen oder Geräten Auskunft zu geben.'”' So können sie für eine Reihe von 
Inter- und Spezialdiskursen aufgrund ihrer statistischen Zugangsweise als dis- 
kursfähig gelten, was menschlichen Akteur:innen nicht in dieser Breite möglich ist. 
Dabei replizieren LLMs Aussagemuster aus den Daten, verändern diese jedoch 
aufgrund der modellimmanenten Restriktionen oder ihrer Bias - seien es Verzer- 
rungen aus den Daten oder eine Folge des reinforced learnings. Bestimmte Diskurse 
werden dadurch erst gar nicht zugelassen.’” In besagtem Fall kann eine KI trotz 
guter Datengrundlage, eben durch ihr Bias, nicht diskursfähig sein. 


6.1 Diskursschleife(n) 


Damit wird ein eigenständiger LLM-Diskurs denkbar, der dann zustande kommt, 
wenn sich LLMs auf LLM-generierte Texte beziehen. Tatsächlich ist Zusammen- 
fassung und Aufbereitung von Text eine Stärke solcher KIs. Nicht nur für schwie- 
rige, weil umfassende oder komplexe Texte bietet sich das an, sondern vor allem für 
eine Bearbeitung großer Datenmengen. In vielen Kommentaren, Diagnosen bis hin 
zu Memes wurde bereits eine Dystopie artikuliert, in der gesamte schriftliche 
Kommunikationen, auf Produzent:innen- und Rezipient:innen-Seite KI-vermittelt 
abläuft. Die KI erstellt zum Beispiel aus einer simplen Aussage einen hochformalen 
Geschäftsbrief, den auf der anderen Seite eine KI wieder in eine vereinfachte Form 
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rückübersetz. Dasselbe ist mit noch weit anspruchsvolleren Textgattungen denkbar. 
Sobald die Zahl der KI-generierten Texte so weit ansteigt, dass diese nur noch über 
algorithmische Verfahren der Data Science oder Big Data auswertbar sind — wobei 
sich hier wiederum State-of-the-Art-LLMs anbieten — würde der Mensch als Akteur 
in den Hintergrund gedrängt und auf die Funktion einer Schnittstelle zwischen 
unterschiedlichen KIs reduziert. 

Die Modelle als künstliche neuronale Netzwerke würden dann menschliches 
Denken substituieren und Bestehendes perpetuierend neu aufgießen beziehungs- 
weise statistisch bis hin zur Unimodalität vereinfachen." Mit dieser Überlegung 
geht die Befürchtung von in sich geschlossenen Kommunikationsschleifen einher, in 
denen sich keine Menschen mehr bewegen, sondern nur noch LLM-Instanzen Texte 
generieren und aufbereiten, was wir als Diskursschleife bezeichnen. Sprache, In- 
halt und Positionen - diskurstheoretisch gesprochen „Aussagen“ — werden dann 
zunehmend vereinheitlicht, wodurch sich der Diskurs mehr und mehr verengt. 
Folgt man Jägers Metapher von Diskurs als „Fluss von Wissen bzw. sozialen Wis- 
sensvorraten durch die Zeit“'°*, käme dies einer Begradigung des Flusslaufs gleich. 
Diese Entwicklung gipfelt darin, dass nur mehr eine standardisierte Abfolge von 
Aussagen zu einem Thema von Kls reproduziert wird, die sich nicht mehr verän- 
dert. Der beschriebene Ansatz lässt sich auch größer denken, indem man nicht auf 
einen Diskurs, sondern auf Sprache und deren epistemische Rolle fokussiert. 
Sprache ist diskursiv prädeterminiert und wird benötigt, um Gedanken zu formu- 
lieren. Je stärker der Einfluss von LLMs auf Sprache an sich ist, desto stärker ist 
menschliches Denken von LLMs beeinflusst, selbst bevor diese von einem Indivi- 
duum verwendet werden.'” 

Abgesehen von diesen epistemischen Bedenken ergeben sich freilich auch 
technische Probleme aus den Folgen von mehr und mehr LLM-generierten Daten, 
die wiederum in LLMs eingespeist werden oder zu deren Training herangezogen 
werden. Darunter fällt zum Beispiel der „model collapse“, ein Effekt bei dem ein 
„generative learning“-Modell von Generation zu Generation immer schlechtere 
Ergebnisse liefert. Dabei spielt „data poisoning“ eine zentrale Rolle: Kontrapro- 
duktive Daten, die vor allem bei der großflächigen Datengewinnung aus dem Netz 
Modelle und deren Leistung verschlechtern.‘ Diese Prozesse wären ebenso Phä- 
nomene der Diskursschleife, wenngleich sie die Verengung des Diskurs durch den 
technisch-konstruktiven Fehler gleichzeitig durchbrechen. Die auftretenden se- 
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mantischen Mutationen laufen jedoch stets Gefahr, durch ihren Nonsens-Charakter 
nicht diskursfähig zu sein und damit in ihrer Wirkung zu verpuffen. 


6.2 Potentiale und Limitationen der Diskursanalyse 


Was ist nun bei der Diskursanalyse von LLM-Texten zu bedenken? Ohne hier auf die 
Spezifika bestimmter Subspezies der Diskursanalyse einzugehen, wollen wir all- 
gemeine Überlegungen anstellen, die möglichst breit anwendbar sind. 

Foucault schreibt in der Ordnung der Dinge, „dass der Mensch verschwindet 
wie am Meeresufer ein Gesicht im Sand“'° und bezieht sich dabei auf das Subjekt, 
dem er nur mehr eine begrenzte Freiheit innerhalb der diskursiven Ordnung zu- 
spricht. Wird ein LLM zum Ko-Autor, verschwindet der Mensch insofern ein Stück 
weiter, da nicht mehr sicher ist, ob bestimmte diskursive Aussagen der Person oder 
dem Modell zuzuordnen sind. Eine Approximation über Vergleichsmaterial 
menschlicher Autor:innen erscheint momentan denkbar, solange es Text von diesen 
gibt, der ohne KI verfasst wurde. Die umgekehrte Annäherungsmöglichkeit wäre 
eine Diskursanalyse von LLMs auf ihr diskursives Bias hin. Da sich die Fähigkeit der 
Modelle verschiedene Sprachen anzuwenden allein aus dem Trainingsmaterial 
ergibt — je weniger, desto schlechter schneiden sie bei der Erfüllung von Aufgaben 
ab'°® - und sie folglich auch nicht auf eine einzelne limitiert sind, ist im immate- 
riellen Vektorenkörper der Modelle keine prinzipielle Unterscheidung zwischen 
Sprachen vorhanden. Deren kultureller Aspekt hingegen ist nur so weit inkludiert, 
als dass er sich aus den Daten ergeben hat. Das moralisch-ethische Finetuning- 
modell geht noch weiter und reduziert diesen Diskursbereich auf eine angelsäch- 
sisch-englische Version. So macht es bei Chat GPT 3.5 etwa keinen Unterschied, ob 
man das Programm auf Deutsch oder Englisch bittet, einen Witz über Jesus zu 
machen, in jedem Fall wird dies mit dem Verweis auf Respektlosigkeit verweigert. 
Kontextuelle Umstände - man denke sich eine amerikanische evangelikale Kir- 
chengemeinde gegenüber einem deutschen Satiremedium - sind aus Vorsicht 
ausgeblendet. 

Die im vorigen Teilabschnitt angesprochenen Diskursposition eines LLMs ließe 
sich für einen bestimmten Zeitpunkt ermitteln, solange man eine stabile Version 
untersuchen kann. Lässt man eine solche Version eine Reihe von Diskursfrag- 
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menten generieren, kann man diese auf ihre Aussagemuster hin analysieren. Es 
wäre auch denkbar, dasselbe mit einer Reihe von LLMs oder verschiedenen Ver- 
sionen eines Modells zu tun, um eine allgemeine Diskursposition von LLMs zu ei- 
nem Thema oder den Diskursstrang zu einem Thema in einem LLM herauszuar- 
beiten.*®° 

Geht man nicht von den LLMs aus, sondern von einem bestimmten Diskurs, so 
ist zu beachten, dass es auch ohne die bereits angesprochene Diskursschleife über 
die Verwendung von LLMs zu einer Verengung beziehungsweise einem „Stre- 
amlining“ des Diskurses — aufgrund des epistemischen Konservatismus der KI - 
kommt." Das Bias der KI wirkt sich selbstredend nicht nur auf das einzelne Dis- 
kursfragment, sondern auf den gesamten Diskurs aus, der in Richtung der kultu- 
rellen Eigenheiten, Normen und Werte der Trainingsdaten verschoben wird und 
außerdem nicht Digitalisierbares sowie bisher noch nicht Digitalisiertes aus- 
schließt. Je nachdem wie homogen oder inhomogen die moralischen Instanzen der 
dominierenden KIs gestaltet sind, können auch diese zu einer Diskursverschiebung 
beitragen. Verknüpft man diesen Gedanken mit dem Vorhaben, eine Diskursanalyse 
von LLMs durchzuführen, so besteht die Gefahr, Diskursschleifen zu potenzieren. 
Nämlich dann, wenn man versucht, diese Analyse von LLMs mit Hilfe von KI-Tools 
zu bewerkstelligen, da so aus dem bereits verengten Diskurs wieder nur die häu- 
figsten, im Sinne von statistisch signifikantesten, Aussagemuster herausgearbeitet 
werden. 


7 Schluss 


Die gegenwärtige Situation bietet eine gute Gelegenheit, den seit Jahren zuneh- 
menden Einfluss von KI auf den Wissenschaftsbetrieb zu reflektieren. Ausgehend 
von dem Stehsatz, dass LLMs ein großes disruptives Potential besitzen und in An- 
sätzen bereits entfalten, lässt sich konstatieren, dass sie die Arbeit mit schriftlichen 
Quellen in der Geschichtswissenschaft, die daraus abgeleitete Epistemologie und 
den Umgang mit (geschichts-Jwissenschaftlichen Texten verändern. 


109 Eine spekulative Fortführung des Gedankens bringt uns zur Repräsentation des Bias im mul- 
tidimensionalen Vektorraum der LLMs. Da die Semantik in Form statistischer Korrelationen und 
damit in Parametern eines Modells abgebildet ist, müssten Diskursposition und Bias eine virtuelle 
körperliche Entsprechung haben. Aus diskursanalytischer Perspektive wäre es hochspannend, 
wenn man mit selbstbezogenen Prompts auf diese Strukturen zugreifen könnte. Theoretisch könnte 
es möglich sein, ein praktischer Test steht unseres Wissens noch aus. 

110 Lopez 2023, 22-23. 
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Wir sehen in den aktuellen Entwicklungen einige Prämissen inklusive ent- 
sprechender Ableitungen. Die vermutlich wichtigste darunter ist, dass menschliche 
Autorschaft weiter in den Hintergrund tritt. Der von der Intertextualitätstheorie 
und Roland Barthes geprägte „Tod des Autors“ wird über die zunehmend autonome 
Textarbeit von LLMs, auch auf semantischer Ebene, offensichtlich. LLMs nehmen 
zwangsläufig immer weiter und unentflechtbar die Position einer Ko-Autorschaft 
ein, die überdies entlang kollektiver Wahrscheinlichkeiten agiert. 

Das betrifft aus Sicht der Geschichtswissenschaft weiters die Produktion von 
Text und die Arbeit mit schriftlichen Quellen. Vor dem Hintergrund der erschwerten 
Nachvollziehbarkeit der Überlieferung und des:der Urhebers:in sowie der Über- 
prüfung der Faktizität, zeichnet sich eine Krise der Quellenkritik ab. Mit ihr einher 
geht das Verblassen der Autorschaft als Garant für Qualität und Verantwortung im 
Sinne der guten wissenschaftlichen Praxis. 

In einem wahrscheinlichen Zukunftsszenario findet sich die Geschichtswis- 
senschaft also zwangläufig mit einem Quellenbestand konfrontiert, der all diese 
verschärften Problemlagen auf sich vereint. Notwendig ist deshalb ein Bewusstsein 
um die Veränderungen und Wege des Umgangs damit. Ein solcher Weg, der aller- 
dings erst angelegt werden muss, ist aus unserer Sicht eine „neue“ allgemeine 
Quellenkritik, idealerweise im theoretisch-praktischen Rahmen der Digital Huma- 
nities. Diese könnte dringend benötigte Dokumentationsstandards festlegen und 
eine normative Orientierung zur Zusammenarbeit von Mensch und Maschine für 
die Geschichtswissenschaft bieten.''' 

Vergrößert man den Referenzrahmen der Beobachtung von einzelnen Quellen 
auf ganze Bestände, ist ein angepasster theoretischer Rahmen notwendig, den wir 
in der Diskurstheorie sehen. Wir haben versucht, damit Phänomene zu erfassen, 
die wir als Diskursverengung bis hin zur Dystopie der Diskursschleife bezeichnen: 
Über die aufgrund ihres Bias in die LLMs eingeschriebenen Diskurspositionen, ihre 
probabilistische Funktionsweise sowie ihren vermehrten Einsatz in Textproduktion 
und -rezeption kommt es zu einer Vereinheitlichung von Sprache und Denken. 
Diese gipfelt im schlimmsten Falle in einer Stagnation der Diskurse in Form von 
abgeschlossenen, sich selbst perpetuierenden Schleifen. 

Abseits dieser Überlegungen kann die Diskursanalyse in Zukunft möglicher- 
weise genau jene inhärenten Diskurspositionen der LLMs aus dem Quellenbestand 
herausarbeiten. Über die Empirie des großen Quellenbestandes werden die in ein 


111 In dieser Hinsicht ist auch ein wechselseitiges Profitieren von Geschichtswissenschaft und 
Entwicklerseite denkbar, beispielsweise bei der Frage nach dem Umgang mit Daten, die mit einem 
Bias versehen sind, wozu die Archivwissenschaft Lösungsansätze bietet. Vgl. Eun Jo/Timnit Gebru, 
„Lessons from Archives“, Proceedings of the 2020 Conference on Fairness, Accountability and 
Transparency, 2020 (DOI: 10.48550/arXiv.1912.10389) (Zugriff: 04.10.2023). 
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Modell oder, aufgrund ähnlicher Trainingsdatensätze, auch über mehrere Modelle 
hinweg eingeschriebenen Positionen zu Wissen und moralischen Verhaltensweisen 
fassbar. Auf diese Weise wäre ein analytischer und stärker reflektierter Umgang mit 
LLMs möglich, durch den der Mensch eventuell doch nicht aufgrund der KI „ver- 
schwindet wie am Meeresufer ein Gesicht im Sand“.'"? 


112 Foucault 2020, 462. 
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KI-geschaffene Übersetzungen als Hilfsmittel zur 
Quellenerschließung in der Geschichtswissenschaft 


Abstract: Digital translation tools such as DeepL, Google Translate or ChatGPT now 
make it possible to receive texts whose language you do not speak. This seems 
problematic in a scientific context because the translations cannot be verified, but it 
also represents a great opportunity because texts that previously remained closed 
due to the language barrier can now be integrated into one’s own studies. The article 
discusses the opportunities and risks of using digitally created translations at uni- 
versities using the example of Latin texts in history. 


Eine der haufigsten Reaktionen, die man als Mediavist*in erhalt, wenn man erzahlt, 
womit man sich beruflich beschäftigt, ist, wie sehr das Gegenüber schon immer am 
Mittelalter interessiert war und wie spannend es diese Zeit findet.‘ Manche Men- 
schen fasziniert die Geschichte so sehr, dass sie sogar ein Geschichtsstudium an- 
gehen. Dabei nimmt dann allerdings die Bereitschaft, sich speziell mit dem Mit- 
telalter zu beschäftigen, deutlich ab. In der Regel werden von Studierenden 
Veranstaltungen aus der Neuzeit am liebsten besucht, wohingegen das Mittelalter 
schon im 19. Jahrhundert als „das Säurebad des Geschichtsstudiums“ bezeichnet 


1 Das populäre Interesse am Mittelalter manifestiert sich in verschiedenen Bereichen: Mittelal- 
termärkten, historischen Romanen, Filmen/Serien, Computerspielen sowie Dokumentationen. Das 
Fach selbst beschäftigt sich wissenschaftlich seit Langem eingehend mit dem populären Mittelal- 
ter — sowohl von Seiten der Public History als auch von Seiten der Mediävisten. Es gibt mittlerweile 
zu viele Untersuchungen, um sie alle hier zu nennen, weshalb lediglich beispielhaft auf das Stan- 
dardwerk von Valentin Groebner, Das Mittelalter hört nicht auf. Über historisches Erzählen, Mün- 
chen 2008 (2023?) sowie der Aktualität halber auf den kürzlich erschienenen Aufsatz von Sebastian 
Kubon, „Das Mittelalter bei Youtube. Das „Tufekci-Experiment“, oder: „Der Algorithmus als The 
Great Radicalizer“, in Klio hat jetzt Internet. Historische Narrative auf Youtube - Darstellung, In- 
szenierung, Aushandlung, hg. von Kilian Baur/Robert Trautmannsberger, Berlin/Boston 2023, 61-80, 
in [www.degruyter.com/document/doi/10.1515/9783110792898/html] (Zugriff: 14.09.2023), verwiesen 
werden soll. 

2 Der Ausdruck geht zurück auf den Vortrag „Geschichte erforschen oder Geschichte schreiben? 
Konkurrierende Leitbilder der historischen Mittelalterforschung seit der Mitte des 19. Jahrhunderts“ 
von Frank Rexroth während der Winterakademie „Was ist Geschichtsschreibung?“ im Alfried- 
Krupp-Wissenschaftskolleg Greifswald vom 16. - 21. Februar 2009. Genauere Ausführungen sind zu 


8 Open Access. © 2024 bei den Autorinnen und Autoren, publiziert von De Gruyter. Dieses Werk ist 


lizenziert unter einer Creative Commons Namensnennung - Nicht kommerziell - Keine Bearbeitung 4.0 International 
Lizenz. https:/doi.org/10.1515/9783111351490-033 
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wurde. Das hat viele Gründe, die hier nicht im Einzelnen dargelegt werden können, 
es liegt aber sicherlich nicht zuletzt daran, dass für das umfassende Studium der 
mittelalterlichen Geschichte Lateinkenntnisse benötigt werden, da der Großteil der 
mittelalterlichen Texte auf Latein verfasst wurde. Einige deutsche Universitäten 
setzen für ein Geschichtsstudium aus diesem Grund Lateinkenntnisse voraus, was 
dazu führt, dass Studierende während ihres Studiums das Latinum nachholen 
müssen. An vielen Universitäten weicht diese Voraussetzung inzwischen auf und 
Studierende können auch ohne Lateinkenntnisse das Studium durchlaufen. Für sie 
werden Veranstaltungen im Bereich der mittelalterlichen Geschichte angeboten, die 
ohne Lateinkenntnisse auskommen. Man arbeitet dann mit wissenschaftlichen 
Übersetzungen, soweit diese vorliegen. 

Grundsätzlich lässt sich festhalten, dass Lateinkenntnisse für das Verständnis 
der mittelalterlichen Geschichte eine zentrale Voraussetzung sind. Diese Voraus- 
setzung ist aber nicht bei allen Studierenden gegeben und selbst Studierende mit 
Lateinkenntnissen meiden das Mittelalter, weil die Beschäftigung mit lateinischen 
Texten sie häufig abschreckt, denn Latein ist — das weiß jede*r — sehr schwer. Dieser 
„Lateinabschreckungscharakter“ der mittelalterlichen Geschichte ist schon immer 
ein Problem im Fach gewesen. Hinzu kommt, dass Studierenden ohne Latein- 
kenntnisse ein sehr großer Anteil des Faches verschlossen bleibt, da sie die Texte 
nicht rezipieren können. Es gibt zwar Übersetzungen in moderne Sprachen, aber 
natürlich nicht für alle Quellen - dazu sind es viel zu viele und außerdem werden 
noch immer neue Quellen erschlossen. 

Auf Grundlage dieser Überlegungen entstand der vorliegende Beitrag. Im 
Rahmen des an der Universität des Saarlandes angesiedelten, vom Bund geförder- 
ten und fächerübergreifenden Projektes DaTa-Pin,’ welches das Ziel hat, Innova- 
tionen im Einsatz von Künstlicher Intelligenz (KTI) in der Lehre zu ermöglichen, um 
Ideen für die Lehre zu entwickeln und zu erproben, untersuche ich zusammen mit 
Cristina Andenna im Teilprojekt „KI-geschaffene Texte und ihre Verwendung in den 
Geisteswissenschaften. Chancen und Grenzen“ gemeinsam mit Studierenden digi- 
tale Text- und Übersetzungstools im Hinblick auf ihren Einsatz in der Lehre in der 
Geschichtswissenschaft. Ein Bestandteil der Untersuchung ist, inwiefern Überset- 
zungstools den Zugang zu schwer oder bislang gar nicht zugänglichen lateinischen 
Texten erleichtern können. 

Im Rahmen einer Übung wurden bereits erste Tests mit Studierenden durch- 
geführt und im vorliegenden Beitrag sollen erste Ergebnisse und Reflexionen vor- 


finden bei Frank Rexroth, „Geschichte erforschen oder Geschichte schreiben? Die deutschen His- 
toriker und ihr Spätmittelalter 1859-2009“, Historische Zeitschrift, Bd. 289, 2009, 109-147. 

3 [www.uni-saarland.de/projekt/digitalisierung/digitalisierungsprojekte/projekt-data-pin.html] (Zu- 
griff: 21.09.2023). 
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gestellt werden. Dabei sei ausdrücklich betont, dass es sich um erste Beobachtungen 
und Überlegungen handelt. Die ausführliche Studie steht im Winter 2023/24 an. 
Gleichwohl können diese ersten Gedanken die grundsätzliche Problematik sowie 
die Chance im Hinblick auf die Verwendung von KI-Ubersetzungen in der Wis- 
senschaft aufzeigen und den Anknüpfungspunkt für weitere Überlegungen bilden.* 


1 Das Experiment 


Unser erstes Kurzexperiment (eine 90-minütige Sitzung im Rahmen einer Übung zu 
Konrad IL) zu digitalen Übersetzungstools fand am 5. Juli 2023 an der Universität des 
Saarlandes statt. Zuerst haben die Studierenden einen Fragebogen ausgefüllt, des- 
sen Ergebnis in Anhang 1 zu sehen ist. Zu erkennen ist deutlich, dass die befragten 
Studierenden nur mäßige Kenntnisse über digitale Tools für ihr Studium haben, 
auch wenn sie selbst das zum Teil anders einschätzen. So geben sie als digitale Tools 
beispielsweise ihr E-Mail-Programm oder LSF und auch MS WORD und POWER- 
POINT an - alles Anwendungen, die nicht primär als digitale Tools für das Ge- 
schichtsstudium zu bezeichnen sind. Aus dem Fragebogen kommt ebenfalls deut- 
lich heraus, dass alle Studierenden gerne mehr über derartige Tools lernen 
möchten. Hinsichtlich der Verwendung von Übersetzungstools zeigt sich ein ge- 
mischtes Bild — einige Studierende geben an, diese bereits zu nutzen, andere ver- 
zichten bislang auf digitale Übersetzungshilfsmittel. 

Im Anschluss an den Fragebogen wurde für das Übersetzungsexperiment ein 
lateinischer Text? als Grundlage genommen, den die Studierenden schon in einer 
früheren Sitzung ausführlich behandelt hatten. Sie haben zu dem lateinischen Text 
eine deutsche® und eine englische’ Übersetzung erhalten, die von Wissenschaftlern 
erstellt und publiziert wurden. Alle drei Texte sind in Anhang 2 zu sehen. Daraufhin 
wurden die Studierenden in Gruppen eingeteilt und erhielten verschiedene Auf- 
gaben. 

Im Folgenden werden die Ergebnisse der Untersuchungen der ersten beiden 
Gruppen vorgestellt. Die erste Gruppe sollte sich mit der Übersetzung des lateini- 


4 Zum Austausch über das Thema kann man mich gerne kontaktieren: miriam.weiss@uni-saar- 
land.de. 

5 Wipo, Gesta Chuonradi II. imperatoris, bearbeitet von Werner Trillmich, in Quellen des 9. und 
11. Jahrhunderts zur Geschichte der hamburgischen Kirche und des Reiches, Darmstadt °1961 (?2000), 
544. 

6 Trillmich 1961, 545. 

7 Imperial lives & letters of the eleventh century, übers. von Theodor E. Mommsen und Karl F. 
Morrison, hg. von Robert L. Benson, New York 2000, 65. 
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schen Textes ins Deutsche und die zweite Gruppe mit der Übersetzung des latei- 
nischen Textes ins Englische beschäftigen. Die Aufgabenstellungen waren für beide 
Gruppen identisch: 


Lassen Sie DeepL und ChatGPT den edierten Quellentext ins Deutsche bzw. Englische über- 
setzen. Verwenden Sie bei ChatGPT drei verschiedene Aufforderungen und vergleichen, ob die 
Ergebnisse sich bei allen drei Aufforderungen decken. Speichern Sie alle Aufforderungen und 
Ergebnisse. 


Vergleichen Sie die Übersetzungsergebnisse der Online-Tools mit der edierten Übersetzung aus 
der Edition. Stellen Sie heraus, was gut funktioniert und wo Probleme liegen. 


Überlegen und begründen Sie, ob Sie die Übersetzungen der Tools für ein Referat oder eine 
Hausarbeit verwenden würden. Überlegen Sie, ob Sie die Übersetzungen der Tools auch ver- 
wenden würden, wenn Sie keine Lateinkenntnisse hätten. 


Als Ergebnis stellten beide Gruppen zunächst fest, dass DeepL nicht aus dem La- 
teinischen übersetzen kann. Als gut funktionierende Tools stellten sich ChatGPT 
und der Google Übersetzer heraus. 

Beide Gruppen merkten schnell, dass ChatGPT je nach Eingabeaufforderung 
(Promt) unterschiedliche Übersetzungsergebnisse lieferte.® Ein Beispiel, nämlich 
der erste Satz des zugrundeliegenden Textes, soll im Folgenden die Ergebnisse der 
Analyse verdeutlichen.” Der lateinische Satz lautet: 


Archiepiscopus Moguntinensis, cuius sententia ante alios accipienda fuit, rogatus a populo, 


quid sibi videretur, abundanti corde, hilari voce laudavit et elegit maioris aetatis Chuononem 
suum in dominum et regem atque rectorem et defensorem patriae. 


Die wissenschaftliche Übersetzung lautet: 
Der Erzbischof von Mainz, der als erster seine Stimme abgeben mußte, kürte und wählte auf 


die Frage des Volkes nach seinem Willen aus übervollem Herzen und mit klarer Stimme den 
älteren Konrad zu seinem Herrn und König, zum Lenker und Schützer des Reiches. 


ChatGPT lieferte bei drei unterschiedlichen Prompts: 


8 Das Problem der Nicht-Reproduzierbarkeit von Ergebnissen bei ChatGPT ist bekannt und hangt 
mit der Funktionsweise des Sprachmodells zusammen, welches über Wahrscheinlichkeiten funk- 
tioniert. Dies wird in zahlreichen Einführungen zu KI und ChatGPT erklärt, z.B. bei Kai Spriester- 
bach, Richtig texten mit KI. ChatGPT, GPT-4, GPT-3 & Co. Texte schreiben mithilfe künstlicher Intel- 
ligenz für Job, Uni und Websites - schneller und besser als je zuvor, München 2023, speziell 47-60. 
9 Alle Zitate stammen aus den Abfragen im Rahmen des Experiments am 5. Juli 2023. Verwendet 
wurde GPT 3.5. 
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Ubersetzte mir bitte diesen Text aus dem Lateinischen ins Deutsche: 

Der Erzbischof von Mainz, dessen Meinung vor allen anderen zu beachten war, wurde vom 
Volk gefragt, was er davon halte. Mit freudigem Herzen und fröhlicher Stimme lobte er und 
wählte seinen älteren Zeitgenossen Chuonon zu seinem Herrn, König und Führer und Ver- 
teidiger des Landes. 


Übersetze mir diesen Text! 

Der Erzbischof von Mainz, dessen Meinung vor allen anderen zu beachten war, wurde vom 
Volk gefragt, wie er dazu stehe. Mit freudigem Herzen und fröhlicher Stimme lobte er und 
wählte seinen älteren Zeitgenossen Chuonon zu seinem Herrn, König und Führer und Ver- 
teidiger des Landes. 


Kannst du mir diesen Text ins Deutsche übersetzen? 

Selbstverständlich! Hier ist die Übersetzung des Textes ins Deutsche: 

Der Erzbischof von Mainz, dessen Meinung vor allen anderen zu beachten war, wurde vom 
Volk gefragt, was er davon halte. Mit freudigem Herzen und fröhlicher Stimme lobte er und 
wählte seinen älteren Zeitgenossen Chuonon zu seinem Herrn, König und Führer und Ver- 
teidiger des Landes. 


Der Google Übersetzer übersetzte: 


Der Erzbischof von Mainz, dessen Entscheidung vor den anderen angenommen werden sollte, 
wurde vom Volk mit überströmendem Herzen nach seiner Meinung gefragt, lobte ihn mit 
fröhlicher Stimme und wählte seinen älteren Chuonon zum Herrn und König sowie Gouver- 
neur und Verteidiger das Land. 


Bei der Analyse der Übersetzungen fallen ein paar Dinge auf: 

Inhaltlich lassen sich einige Sachverhalte beobachten. Zunächst fügte ChatGPT 
ein Satzzeichen, nämlich einen Punkt, ein und machte damit aus einem lateinischen 
Satz zwei deutsche Sätze. Außerdem werden Teile des Satzes in mehreren Versio- 
nen der Übersetzung unterschiedlich übersetzt. Hier sei beispielhaft das lateinische 
„quid sibi videretur“ betrachtet, welches insgesamt vier verschiedene Überset- 
zungen erfährt, wobei zwei davon vom gleichen Tool - nämlich ChatGPT - ausge- 
geben wurden. 


„quid sibi videretur“ nach seinem Willen (wissenschaftliche Übersetzung) 
was er davon halte (ChatGPT) 
wie er dazu stehe (ChatGPT) 
nach seiner Meinung (Google Übersetzer) 


Bei genauer Betrachtung lässt sich erkennen, dass ChatGPT wörtlicher übersetzt, 
während der Google Übersetzer seine Übersetzung ebenso wie der Wissenschaftler 
sprachlich an den deutschen Satz anpasst. Der Wissenschaftler verschärft die Be- 
deutung der lateinischen Worte außerdem. Der Wille des Erzbischofs ist etwas 
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anderes als die Meinung des Erzbischofs. Aus übersetzender Sicht treffen die di- 
gitalen Tools den lateinischen Text besser als der Wissenschaftler, der mit seiner 
Übersetzung bereits eine Tendenz und damit eine Interpretation der lateinischen 
Worte mitliefert. Zu fragen bliebe an dieser Stelle, ob irgendeine der Übersetzungen 
aus wissenschaftlicher Sicht falsch ist. Das wäre bei allen vier Sätzen zu verneinen. 

Anders sieht es bei der Übersetzung des Protagonisten des Textes aus, nämlich 
bei Konrad II. Dieser heißt im lateinischen Original Chuononem im Akkusativ, also 
im Nominativ 


„Chuono“ Konrad (wissenschaftliche Übersetzung) 
Chuonon (ChatGPT und Google Übersetzer) 


Man sieht, dass die digitalen Tools auch hier rein übersetzen, also versuchen, den 
Namen der Person aus der Grammatik abzuleiten, während der Wissenschaftler 
aufgrund seiner Expertise in der Lage ist, den lateinischen Namen richtig zuzu- 
ordnen. 

Die englischen Übersetzungen, die auf englische Prompts zurückgehen, liefer- 
ten ein wenig andere Ergebnisse. Es wurden keine falschen Satzzeichen eingefügt, 
und der Ausdruck „quid sibi videretur“ wurde drei Mal gleich als „what he thought“ 
übersetzt. Konrad II. wurde in den richtigen Nominativ, nämlich „Chuono“ gesetzt, 
den auch der wissenschaftliche Übersetzer wählte, allerdings in Form von „Cuono“. 
„Kuono“ ist in der deutschen Wissenschaft natürlich auch als Synonym für Konrad 
bekannt. Die englische Übersetzung scheint damit dem lateinischen Text näher zu 
kommen, wobei auch hier bei den drei Prompts unterschiedliche Übersetzungen für 
einzelne Wörter zu finden sind. Allerdings weist ChatGPT in der englischsprachigen 
Version auf diese Probleme hin: „Please note that while I strive to provide an acc- 
urate translation, the complexity and nuances of Latin can sometimes result in 
different interpretations.“ 

Im Hinblick auf die unterschiedlichen Übersetzungen bei unterschiedlichen 
Prompts ließen die Studierenden ChatGPT im Englischen selbst seine drei unter- 
schiedlichen Übersetzungsversionen vergleichen. Die Unterschiede wurden dann 
ordentlich aufgelistet und es wurde eine Gesamtbewertung gegeben: 


Upon comparing the three texts you provided, here are the differences in their content: 

First Text: 

- Mentions that the Archbishop of Mainz chose „his own elder Chuono“ as lord, king, ruler, and 
defender of the country. 

- Emphasizes the persistence in Chuono as the chosen one and places him above all ruling 
powers without hesitation. 

- Highlights that Chuono had little benefit and power in public affairs compared to other men 
of singular power. 
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Second Text: 

- Mentions that the Archbishop of Mainz chose Chuono of greater age as lord, king, ruler, and 
defender of the country. 

- Does not specify that Chuono is the archbishop’s „own“ Chuono. 

- Emphasizes the unanimous agreement and desire for the elder Chuono among all the princes. 

- States that Chuono had little benefit and power in public affairs compared to other men of 
singular power. 


Third Text: 

- Similar to the second text in terms of content. 

- Does not specify that Chuono is the archbishop’s „own“ Chuono. 

- Emphasizes the unanimous agreement and desire for the elder Chuono among all the princes. 

- States that Chuono had little benefit and power in public affairs compared to other men of 
singular power. 


Overall, the differences between the second and third texts are minimal, with minor variations 
in wording and sentence structure. The first text, however, contains some unique details re- 
garding Chuono being the archbishop’s „own“ Chuono and the specific emphasis on his lack of 
benefit and power in public affairs. 


Im Folgenden werden die konkreten Beispiele verlassen und die zentralen Ergeb- 
nisse verallgemeinert und im Kontext des Sammelband-Themas reflektiert. 


2 Die Ergebnisse 


Digitale Ubersetzungstools bringen Ubersetzungen und damit neue Texte hervor. In 
Bezug auf den Umgang mit diesen Texten in der Geschichtswissenschaft stellen sich 
zwei zentrale Fragen: Sind sie für wissenschaftliche Zwecke ausreichend? Und 
sollten sie von Studierenden verwendet werden?'° 


10 Diese beiden Fragen sind natürlich nicht nur für die Geschichtswissenschaft relevant, sondern 
betreffen alle wissenschaftlichen Fächer. Wie sollen Wissenschaftler*innen mit der Möglichkeit 
umgehen, dass Texte in Zukunft aus sämtlichen Sprachen übersetzt werden können? Sollen diese 
Übersetzungen für wissenschaftliche Arbeiten verwendet werden, auch wenn die Nutzer*innen die 
Sprache, aus der übersetzt wurde, nicht beherrschen? Darüber hinaus betrifft die Schwierigkeit 
nicht nur die Wissenschaften, sondern fast alle Lebensbereiche. Ausführliche Überlegungen für den 
Bereich der öffentlichen Verwaltung sind beispielsweise zu finden in der Studie von Christian 
Djeffal/Antonia Horst, Übersetzung und Künstliche Intelligenz in der öffentlichen Verwaltung, Berlin 
2021, in [negz.org/wp-content/uploads/2022/12/17_Kurzstudie_Uebersetzung-und-kuenstliche-Intelli- 
genz2021.pdf] (Zugriff: 14.09.2023). 
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Das kurze Experiment zeigte, dass Übersetzungen von ChatGPT und Co. eng am 
Originaltext bleiben. Als problematisch erscheint das Aufteilen eines Satzes in 
mehrere Sätze, da dies zu Sinnveränderungen führen kann. Dieses Problem ist al- 
lerdings für die Geschichtswissenschaft nicht neu, da auch bei der Transkription 
vom originalen Ursprungstext in eine Edition Satzzeichen hinzugefügt werden, die 
den Sinn des Originals verändern können.'' Dies sollten Historiker*innen also 
immer mitberücksichtigen. Ein weiteres Problem besteht darin, dass ChatGPT bei 
unterschiedlichen Prompts unterschiedliche Übersetzungen ausgibt. Deren Unter- 
schiede sind zwar im Experiment nicht sinnentstellend, können aber zu einer 
Unsicherheit in Bezug auf Übersetzungsergebnisse von ChatGPT führen. Derartige 
Unsicherheiten lassen sich dann nur beheben, wenn die Ergebnisse kontrolliert 
werden, was wiederum nur mit Lateinkenntnissen möglich ist. 

Die digitalen Tools versagen oft bei der korrekten Identifizierung historischer 
Personen und Orte. Das ist allerdings auch keine wirkliche Übersetzungsaufgabe 
und stellt für Historiker*innen immer eine zentrale Herausforderung bei der Be- 
arbeitung von Quellen in Originalsprache dar. Hier ist die wissenschaftliche Über- 
setzung hilfreicher, weil die Arbeit bereits von einer Fachperson übernommen 
wurde. 

Zusammenfassend lässt sich damit sagen, dass Übersetzungen, die von digitalen 
Tools angefertigt wurden, von Wissenschaftler*innen genauso behandelt werden 
sollten wie wissenschaftliche Übersetzungen. Bei all diesen Texten ist Fachwissen 
nötig, welches eine Person in die Lage versetzt, die Übersetzung zu beurteilen. Es ist 
daher von großem Vorteil, Lateinkenntnisse zu haben, um Übersetzungen kon- 
trollieren zu können, bevor man sie im wissenschaftlichen Kontext verwendet.'? 
Zentrale Voraussetzung für die Arbeit mit Übersetzungen im Fach Geschichte sollte 
also sein, Unstimmigkeiten zu erkennen. Das geht einerseits über die Sprache, z.B. 
wenn das Deutsche seltsam anmutet, oder über die Erfahrung, z.B. wenn man weiß, 


11 Dazu vgl. z.B. Matthias Thumser, „Zehn Thesen zur Edition deutschsprachiger Geschichtsquellen 
(14.-16. Jahrhundert)“, in Editionswissenschaftliche Kolloquien 2005/2007. Methodik - Amtsbücher. 
Digitale Edition - Projekte, hg. von Matthias Thumser/Janusz Tandecki, Torun 2008, 13-19, speziell 18, 
These 6: „Die Interpunktion wird nach grammatischen Gesichtspunkten eingerichtet. Elementare 
Aufgabe des Herausgebers ist es, die Interpunktion der Vorlage, vornehmlich bestehend aus Punkt 
und Virgel, durch die heute gebräuchlichen Satzzeichen zu substituieren und den Satzbau ent- 
sprechend zu organisieren. Diese Normalisierung bedeutet zwar einen schwerwiegenden Eingriffin 
den überlieferten Text und einen ersten Ansatz der Interpretation zugleich, dient aber in hohem 
Maße der Erleichterung des Verständnisses.“ 

12 Zu dem gleichen Ergebnis kamen auch die Studierenden, die einhellig der Meinung waren, dass 
die Übersetzungen zwar hilfreich sein können, um einen schnellen Einblick in eine Quelle zu be- 
kommen, für den wissenschaftlichen Gebrauch aber nur dann hilfreich sind, wenn man die be- 
treffende Sprache selbst beherrscht und die Übersetzung kontrollieren und beurteilen kann. 
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dass ein Ausdruck im Mittelalter nicht verwendet wurde oder Chuonem Konrad Il. 
sein muss. Die Übersetzungen werden damit selbst zu Quellen, die kritisch be- 
trachtet und analysiert werden müssen. Auf den ersten Blick erscheint es nicht von 
Bedeutung, ob eine wissenschaftliche oder eine von ChatGPT generierte Überset- 
zung vorliegt. Bei näherer Betrachtung bietet die wissenschaftliche Übersetzung 
aber einen Fußnotenapparat und übernimmt Orts- und Personenidentifikation. 
Gleichzeitig bietet sie häufig interpretative Übersetzungen, die gleichwohl mit 
Vorsicht zu genießen sein können. Das heißt: Wer in der Lage ist, die Qualität einer 
Übersetzung zu analysieren und zu beurteilen, kann bei kritischer Betrachtung alle 
Übersetzungen für wissenschaftliche Zwecke nutzen. Die Übersetzung dient somit 
als Brücke, um Zugang zum originalen Text zu erhalten. 


3 Das Problem 


Genau hier stellt sich eine zentrale Frage: Was ist mit Personen, die keine Latein- 
kenntnisse besitzen? Sollen sie weiterhin vom Zugang zu einem Großteil der mit- 
telalterlichen Quellen ausgeschlossen bleiben, weil sie nicht in der Lage sind, 
Übersetzungen von ChatGPT kritisch zu betrachten? Oder ist es begrüßenswert, 
dass sie fortan mit Hilfe digitaler Tools an Quellen herankommen, die ihnen bislang 
verschlossen geblieben sind? 

Es ist offensichtlich, dass eine*n Forscher*in die Übersetzung ohne eigene 
Lateinkenntnisse nicht näher an den ursprünglichen lateinischen Text heranbringt, 
sondern dass die Übersetzung eine neue Art von Text ist, der für sich selbst Gül- 
tigkeit erhält. Dies gilt natürlich gleichermaßen für wissenschaftliche Übersetzun- 
gen. Wenn Studierende eine Quelle nur in Übersetzung rezipieren und interpre- 
tieren können, so ist es immer möglich, dass sie ihre Interpretationen auf 
Bestandteile aufbauen, die einer komplizierten Übersetzung geschuldet sind. Glei- 
ches wäre für Übersetzungen mit Hilfe digitaler Tools der Fall und erscheint 
dementsprechend kein ausreichender Grund, die Übersetzungen nicht zu ver- 
wenden. Für einen schnellen Einblick in den Inhalt einer Quelle scheinen sie in 
jedem Fall sehr hilfreich zu sein. Können sie aber im wissenschaftlichen Kontext als 
Textgrundlage dienen? 

Im Vergleich zu Übersetzungen durch ChatGPT haben wissenschaftliche 
Übersetzungen den klaren Vorteil, dass sie angeben, worauf sie die Übersetzung 
gründen, in den Fußnoten Schwierigkeiten erläutern und sich problemlos zitieren 
lassen. Insbesondere ist die publizierte Übersetzung eines Autors oder einer Au- 
torin immer gleich und jeder kann ebendiese Übersetzung einsehen. ChatGPT liefert 
wie gesehen unterschiedliche Übersetzungstexte ohne weiterführende Bemerkun- 
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gen. Das heißt, es ist bei der Arbeit mit diesen Übersetzungen unbedingt erfor- 
derlich, den übersetzten Text und möglichst auch den verwendeten Prompt der 
eigenen Interpretation beizufügen. Denn man kann sich nicht darauf verlassen, 
dass jemand anderes von ChatGPT den gleichen Übersetzungstext erhält wie man 
selbst. All dies muss aber zunächst für Nutzer*innen geklärt sein, bevor diese 
Übersetzungen verwendet werden. Außerdem muss die Problematik der nicht 
identifizierten Personen und Orte bekannt sein, damit man diese Arbeit selbst 
übernehmen kann. Generell sollte berücksichtigt werden, dass die Arbeit mit 
ChatGPT auf Englisch bislang die besseren Ergebnisse bringt. Sind sich Studierende 
dieser Eigenheiten von KI-generierten Übersetzungen bewusst, scheinen diese mir 
mehr Chance als Gefahr für die Wissenschaft zu sein, denn das kritische Betrachten 
und Hinterfragen von Texten ist und bleibt eine zentrale Kernkompetenz von 
Historiker*innen und ChatGPT und Co. liefern lediglich einen Text mehr, der in 
diesem Sinne behandelt werden möchte. 


4 Die Aufgabe 


An dieser Stelle sei noch ein kurzer Blick auf die Zweitbefragung der Studierenden 
im Anschluss an das Experiment geworfen (Anhang 3). Fast alle fühlten sich nach 
der Sitzung sicherer im Umgang mit den behandelten digitalen Tools und alle 
möchten mehr über digitale Tools für ihr Studium erfahren. Aus diesem Grund 
sollte man sich mit den neuen Möglichkeiten beschäftigen und schnellstmöglich 
methodische Hilfestellungen für den Umgang mit KI-geschaffenen Texten entwi- 
ckeln.'* Dafür sind Kompetenzen erforderlich, die - zumindest in der Geschichts- 


13 Auch damit zeigt sich ein bekanntes Problem in Bezug auf ChatGPT, nämlich die fehlende 
Transparenz, die gerade im wissenschaftlichen Kontext von grundlegender Bedeutung ist; mehr 
dazu z.B. bei Dominikus Herzberg, „Künstliche Intelligenz in der Hochschulbildung und das 
Transparenzproblem: Eine Analyse und ein Lösungsvorschlag“, in Künstliche Intelligenz in der 
Hochschulbildung. Chancen und Grenzen des KI-gestützten Lernens und Lehrens, hg. von Tobias 
Schmohl et al., Bielefeld 2023, 87-98. 

14 An derartigen Hilfestellungen zur Anwendung von KI in Wissenschaft und Lehre arbeiten 
derzeit zahlreiche Hochschulen. Während sich das Saarbrücker Projekt einem digitalen Reader für 
die Geschichtswissenschaft mit didaktischen Hinweisen widmet, adressiert das Berliner Projekt 
AISkills bereits eine weit größere Zielgruppe, in [http://www.projekte.hu-berlin.de/de/ai-skills/ai-ski 
lls] Zugriff: 14.09.2023). Darüber hinaus entstehen zahlreiche Veröffentlichungen zur Anwendung 
von Klin der Hochschulbildung, wie beispielsweise der Sammelband von Tobias Schmohl/Alice 
Watanabe/Kathrin Schelling (Hg.), Künstliche Intelligenz in der Hochschulbildung Chancen und 
Grenzen des Klgestützten Lernens und Lehrens, 2023, oder das Whitepaper der Uni Hohenheim 
„Unlocking the Power of Generative AI Models and Systems such as GPT-4 and ChatGPT for Higher 
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wissenschaft — ohnehin zum Handwerk gehören und nun lediglich auf neue Arten 
von Texten ausgerichtet werden müssen.'” Die methodischen Hilfestellungen sind 
zu unterrichten, um Studierenden neue Wege aufzuzeigen. Zu diesen Hilfestellun- 
gen gehören die Bewusstmachung von Fragen wie „Wie funktioniert die KI?“, „Was 
kann die KI und was kann sie nicht?“ und simple neue Regeln wie das Beilegen der 
verwendeten Prompts und Texte zur eigenen Studie, damit Studierende und Do- 
zierende auf der gleichen Grundlage arbeiten können. 

Gerade im Kontext der Übersetzungen sei herausgestellt, dass es sich hier nicht 
um Kl-geschaffene Texte handelt, die Nutzer*innen auch selbst hätten erstellen 
können. Die KI liefert einen Mehrwert, der ohne die digitalen Möglichkeiten nicht 
gegeben wäre. Personen ohne Lateinkenntnisse werden sich wahrscheinlich nicht 
von selbst damit befassen, diese Sprache zu lernen, solange es nicht zwingend er- 
forderlich ist. Die KI „ersetzt“ hier keine menschlichen Fähigkeiten, sondern er- 
weitert sie. Das unterschiedliche Abschneiden von Studierenden war schon im- 
mer so und scheint mir kein Grund zu sein, die Chance von Kl-geschaffenen 


Education. A Guide for Students and Lecturers“, 2023, in [https://tip.de/gjl2p] (Zugriff: 14.09.2023), der 
Blogbeitrag von Christian Spannagel, „ChatGPT und die Zukunft des Lernen: Evolution statt Revo- 
lution“, 2023, in [https:/wwwhochschulforumdigitalisierung.de/de/blog/chatgpt-und-die-zukunft- 
des-lernens-evolution-statt-revolution] (Zugriff: 14.09.2023), oder auch Beiträge für unterschiedliche 
Disziplinen wie Michael Neumann/Maria Rauschenberger/Eva-Maria Schön, „We need to talk about 
ChatGPT: The future of Al and higher education“, 2023, in [https://tip.de/76cja] (Zugriff: 14.09.2023) für 
den Bereich des Software Engineering. 

15 Ähnliches erläuterte bereits beispielsweise Hubertus Kohle, „Die Geisteswissenschaften und das 
Digitale. Ein Quantensprung oder business as usual?“, in #DigiCampus. Digitale Forschung und Lehre 
in den Geisteswissenschaften, hg. von Harald Klinke, 2018, 9-17, für die Digitalität in den Geistes- 
wissenschaften allgemein. Ganz aktuell wurde das Thema unter Historikern auf dem Historikertag 
2023 am 20. September in Leipzig in der von Torsten Hiltmann organisierten Sonderveranstaltung 
„Geschichte aus der Maschine. Potenziale, Herausforderungen und Gefahren der ‚Künstlichen 
Intelligenz‘ für unser Fach“ diskutiert. 

16 Die Sorge und teilweise auch Befürchtung, dass die KI den Menschen ersetzen könnte, wird seit 
langem öffentlich diskutiert und bekam 2022 mit ChatGPT einen neuen Boom, in dessen Rahmen 
sich auch Historiker*innen wieder zu Wort meldeten. Dazu vgl. beispielsweise das Interview 
»ChatGPT: Vor der allwissenden KI brauchen wir und noch nicht zu fürchten“ mit Stefan Strauß, 
2023, in [oeawac.at/news/chatgpt-vor-der-allwissenden-ki-brauchen-wir-uns-noch-nicht-zu-fuerch- 
ten] (Zugriff: 15.09.2023) oder das Interview „ChatGPT kann nicht Geschichte schreiben“ mit Jo- 
hannes Preise-Kapelle, 2023, in [oeawac.at/news/chatgpt-kann-nicht-geschichte-schreiben] (Zugriff: 
15.09.2023) oder — speziell für die Mediävistik — Lorenzo Dell’Oso, „ChatGPT e il futuro della me- 
dievistica: alcune proposte“, 2023, in [leparoleelecose.it/?p=47239] (Zugriff: 14.09.2023). Ein großes 
Publikum erreicht auch der Bestseller-Autor und Neurowissenschaftler Joachim Bauer, Realitäts- 
verlust. Wie KI und virtuelle Welten von uns Besitz ergreifen — und die Menschlichkeit bedrohen, 
München 2023, mit aus mediävistischer Sicht interessanten und amüsanten Bezügen zum Mittel- 
alter, insbesondere 24-26. 
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Übersetzungen in der Wissenschaft ungenutzt zu lassen. Es sollte vielmehr als 
Aufgabe der Dozierenden angesehen werden, die Studierenden auch im Umgang 
mit KI-bezogenen Anwendungen bestmöglich zu unterstützen. 


Anhänge 


Anhang 1 Erstbefragung, Auswertung (11 Studierende) 


1) Ich fühle mich sicher im Umgang mit digitalen Tools in Bezug auf mein Studium. 
- Ja — 6 

- Gehtso — 4 

- Nein — 1 


2) Ich kenne die folgenden digitalen Tools, die ich regelmäßig für mein Studium 
verwende: 

LSF (2x), Moodle (4x), SULB, Webmail (3x), MS Teams (3x), Powerpoint (2x), google 
docs, google drive, google slides, Zotero, Canva, JSTOR (2x), Discord, Microsoft 365, 
PDF Converter, Adobe Acrobat, WORD, Excel, Regesta Imperii (2x), DeepL, Daten- 
banken, Microsoft Office (2x), ChatGPT, Bryn Mawr Classical review, Plekos, Orbis, 
Beck e-library, Frankfurter elektronische Rundschau Altertumskunde, H-Soz-Kult, 
Perseus digital library, the Latin library, Enzyklopädie der Neuzeit, dMGH, Ge- 
schichtsquellen.de, DNP 


3) Ich würde gerne mehr über digitale Tools, die ich für mein Studium verwenden 
kann, lernen. 

- Ja — 1 

- Geht so 

— Nein 


4) Ich verwende regelmäßig Übersetzungstools. 


= Ja —5 

- Selten — 3 

- Nein — 3 

Welche? 

- DeepL — 4 

— Google Übersetzer — 5 


— Frag Caesar — 2 
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ChatGPT —— 2 
Pons — 1 
Wörterbuch — 1 


Anhang 2 Die Königswahl Konrads II. in verschiedenen 


Sprachen 


Lateinische Edition entnommen aus: Wipo, Gesta Chuonradi II. imperatoris, be- 
arbeitet von W. Trillmich, in Quellen des 9. und 11. Jahrhunderts zur Geschichte der 
hamburgischen Kirche und des Reiches, Darmstadt °1961 (72000), 544: 


Archiepiscopus Moguntinensis, cuius sententia ante alios accipienda fuit, rogatus a populo, 
quid sibi videretur, abundanti corde, hilari voce laudavit et elegit maioris aetatis Chuononem 
suum in dominum et regem atque rectorem et defensorem patriae. Hanc sententiam caeteri 
archiepiscopi et reliqui sacrorum ordinum viri indubitanter sequebantur. Iunior Chuono 
paululum cum Liutharingis placitans statim reversus maximo favore illium ad dominum et 
regem elegit, quem rex manu apprehendus fecit illum consedere sibi. Tunc singuli de singulis 
regnis eadem verba electionis saepissime repetebant; fit clamor populi, omnes unanimiter in 
regis electione principibus consentiebant, omnes maiorem Chuononem desiderabant; in illo 
persistebant, ipsum cunctis dominantibus nihil haesitando praeposuerunt eundemque regali 
potentia dignissimum iudicabant et, ut nulla mora consecrationis illius fieret, postulabant. 
Supra dicta imperatrix Chunegunda regalia insignia, quae sibi imperator Heinricus reliquerat, 
gratanter obtulit et ad regnandum, quantum huius sexus auctoritatis est, illum corroboravit. 
Credo quidem huic electioni caelestium virtutum favorem non deesse, cum inter singularis 
potentiae viros, tot duces et marchiones absque invidia, sine controversia is eligeretur, qui, licet 
genere et virtute atque in propriis bonis nemine esset inferior, tamen de re publica ad com- 
parationem talium virorum parum beneficii et potestatis habuit. 


Übersetzung deutsch aus: Wipo, Gesta Chuonradi II. imperatoris, bearbeitet von W. 
Trillmich, in Quellen des 9. und 11. Jahrhunderts zur Geschichte der hamburgischen 
Kirche und des Reiches, Darmstadt 1961 (72000), S. 545. 


Der Erzbischof von Mainz, der als erster seine Stimme abgeben mußte, kürte und wählte auf 
die Frage des Volkes nach seinem Willen aus übervollem Herzen und mit klarer Stimme den 
älteren Konrad zu seinem Herrn und König, zum Lenker und Schützer des Reiches. Diesem 
Spruche schlossen sich die anderen Erzbischöfe und die übrigen Herren geistlicher Stände an 
ohne zu zögern. Sogleich wandte sich der jüngere Konrad um, der eine Zeitlang mit den 
Lothringern verhandelt hatte, und erwählte ihn bereitwilligst zu seinem Herrn und König; der 
König ergriff seine Hand und ließ ihn neben sich sitzen. Dann wiederholten alle aus den 
verschiedenen Königreichen einzeln immer wieder den gleichen Kürspruch. Das Volk rief 
Beifall, alle stimmten einmütig der Königswahl der Fürsten zu, alle wünschten den älteren 
Konrad. Dabei blieben sie, ihn setzten sie ohne Zögern über alle Machthaber, ihn hielten sie für 
den der Königsmacht Würdigsten und forderten unverzüglich seine Weihe. Gern übergab ihm 
die schon genannte Kaiserin Kunigunde die königlichen Insignien, die ihr Kaiser Heinrich 
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hinterlassen hatte, und bevollmächtigte ihn dadurch zur Herrschaft, soweit ihr Geschlecht das 
vermag. Ich meine wohl: Dieser Wahl fehlte die Gunst der himmlischen Gnade nicht, denn 
unter Männern von außerordentlicher Macht und so vielen Herzögen und Markgrafen wurde 
ohne Neid und Streit einer erwählt, der wohl an Geburt, Tüchtigkeit und Eigengut niemandem 
unterlegen war, vom Reiche aber im Vergleich mit solchen Männern wenig Lehen und Amts- 
gewalt besaß. 


Übersetzung englisch entnommen aus: Imperial lives & letters oft he eleventh 
century. Translated by Theodor E. Mommsen/ Karl F. Morrison. With a historical 
introduction and new suggested readings by Karl F. Morrison, hg. von Robert L. 
Benson, New York 2000, 65: 


The Archbishop of Mainz, whose opinion had to be taken before all, asked by the people what 
was seemly to him, with a full heart and a happy voice, acclaimed and elected the elder Cuono 
as his lord and king, and rector and defender oft he fatherland. The other archbischops and the 
remaining men of holy orders unhesitatingly followed him in this vote. The younger Cuono, 
who hat been negotiating for a short time with the Lotharingians, returned suddenly and 
elected him as lord and king with greatest good will. The King, taking him by the hand, made 
him sit beside him. 


Then, one by one, men from each of the several realms repeated the same words of election 
again and again; there was a shout of acclamation by the people; all consented unanimously 
with the princes in the election oft he King; all eagerly desired the elder Cuono. On him they 
insisted; him they placed without any hesitation before all the mighty lords; hin they judged to 
be most worthy of the regal power; and they demanded that there be no delay of his consec- 
ration. The abovementioned Empress Chunegunda graciously brought forth the regal insignia 
which Emperor Henry had left to her and supported him for governance as far as lay within the 
authority of her sex. I believe that the good will of heavenly powers, indeed, was not absent 
from this election, since among men of singular power, among so many dukes and margraves, 
he was elected without malice, without controversy; he, who, although he was inferior to no 
one in the family and in valor and in allodial goods, nevertheless in comparison with such men 
held of the state but little in fief and in power. 


Anhang 3 Zweitbefragung, Auswertung (12 Studierende) 


5) Ich fühle mich nach der Sitzung sicherer im Umgang mit den behandelten di- 
gitalen Tools in Bezug auf mein Studium. 

- Ja — 9 

- Gehtso — 2 

- Nein — 1 


6) Ich würde gerne mehr über digitale Tools, die ich für mein Studium verwenden 
kann, lernen. 
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- Ja — 2 
— Geht so 
— Nein 


7) Ich werde zukünftig regelmäßig Ubersetzungstools verwenden. 
- Ja — 8 

— Ehernicht — 4 

— Nein 


Welche? 

- ChatGPT — 5 

- DeepL —— — 4 
— Google Übersetzer — 2 
— Frag Caesar — 1 

— Die, die ich finde — 1 


8) Ich bin nach der Sitzung in der Lage, die behandelten digitalen Tools kritisch auf 
ihre Verwendbarkeit hin zu beurteilen und dies bei der Verwendung zu be- 
rücksichtigen. 

- a — 2 

— Eher nicht 

— Nein 


Verzeichnis der Beitragenden 


Steffen Albrecht, Dr., Wissenschaftlicher Mitarbeiter im Büro für Technikfolgen-Abschätzung beim 
Deutschen Bundestag, Berlin (albrecht@tab-beim-bundestag.de). 


Thomas Arnold, Dr., PostDoc-Wissenschaftler im Ubiquitous Knowledge Processing (UKP) Lab an der 
Technischen Universitat Darmstadt (thomas_otmar.arnold@tu-darmstadt.de). 


Ulrike Aumüller, Mitarbeiterin im Forschungs- und Entwicklungszentrum Fachhochschule Kiel GmbH 
(ulrike.aumueller@ai2e.de). 


Amrei Bahr, Jun.-Prof. Dr., Juniorprofessorin für Philosophie der Technik und Information an der Uni- 
versität Stuttgart (amrei.bahr@philo.uni-stuttgart.de). 


Jenifer Becker, Autorin, Künstlerin und Postdoc-Wissenschaftlerin am Institut für Literarisches Schrei- 
ben und Literaturwissenschaft der Universität Hildesheim (becke005@uni-hildesheim.de). 


Maximilian Behrens, Freiwilliger Mitarbeiter am Forschungs- und Entwicklungszentrum Fachhoch- 
schule Kiel GmbH (behrens.maximilian@yahoo.com). 


Oliver Bendel, Prof. Dr., Professor im Kompetenzschwerpunkt Digital Trust am Institut für Wirt- 
schaftsinformatik an der Fachhochschule Nordwestschweiz (oliver.bendel@fhnw.ch). 


Raphael Besenbäck, M.A., Wissenschaftlicher Mitarbeiter am Institut für Geschichte der Universität 
Wien (raphael.besenbaeck@univie.ac.at). 


Andreas Brenneis, Wissenschaftlicher Mitarbeiter am Institut für Philosophie an der Technischen Uni- 
versität Darmstadt (andreas.brenneis@tu-darmstadt.de). 


Kathrin Burghardt, Wissenschaftliche Mitarbeiterin im Forschungsprojekt „Diskurse disruptiver digi- 
taler Technologien am Beispiel von KI-Textgeneratoren“, Institut für Theologie und Sozialethik der 
Technischen Universität Darmstadt (kathrin.burghardt@tu-darmstadt.de). 


Gerd Doeben-Henisch, Prof. Dr., Mitglied des Fachbereichs Informatik und Ingenieurswissenschaften 
an der Frankfurt University of Applied Sciences (doeben@fb2.fra-uas.de). 


Petra Gehring, Prof. Dr., Professorin für Philosophie an der Technischen Universität Darmstadt (geh- 
ring@phil.tu-darmstadt.de). 


Alisa Geiß, Illustratorin und Masterandin im Fach Ästhetik an der Goethe-Universität Frankfurt (gei- 
ss@uni-frankfurt.de). 


Dominik Gerstorfer, M.A., Wissenschaftlicher Mitarbeiter am Fachgebiet Digital Philology - Neuere 
deutsche Literaturwissenschaft am Institut für Sprach- und Literaturwissenschaft der Technischen Uni- 
versität Darmstadt (dominik.gerstorfer@tu-darmstadt.de). 
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Evelyn Gius, Prof. Dr., Professorin für Digital Philology - Neuere Deutsche Literaturwissenschaft am 
Institut für Sprach- und Literaturwissenschaft der Technischen Universität Darmstadt (evelyn.gius@tu- 
darmstadt.de). 


Felix Hermonies, Prof. Dr., Professor für Informationsrecht an der Hochschule Darmstadt (fe- 
lix.hermonies@h-da.de). 
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Bildungsanstrengung, eigene 357 

Bildungseinrichtung 31, 359, 479 

Bildungsgedankens 358 

Bildungssystem 315, 356f., 474 

Bindung, emotionale 42, 207, 287 

Black Box 7, 67f., 71-73, 79, 460, 481, 484f., 
492 

Blaulicht-Symbolen 412 

Blogposts 89 

Blogs 40, 96 

BloombergGTP 453 

Bots 191, 358, 401 

Boulevardjournalismus 406 

Branchen 303, 448 

Brechungen 288 

Browser 298 

Browserimplementierungen 133 

Bryn 532 

Buchstabenfolge 

Bürgertum 57, 60 

Büro für Technikfolgenabschätzung am Bundes- 
tag (TAB) 14, 16, 20, 24, 314, 327f., 342 

Bürokratisierung 131 


172f., 178f., 220 


Canva 532 
capital fixe 127 
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Captions 90 

Chancen 2, 5, 14, 36, 48, 61, 65, 80, 149, 183, 
292, 305-308, 314, 316f., 333, 337, 342, 351, 
356, 358, 373, 379, 381, 436, 454, 522, 530 

Chatbot 2, 13, 15, 18-21, 55, 59f., 64, 83, 88f., 
92-94, 99, 115, 202, 291, 293, 295, 298, 301, 
341-343, 346f., 358, 419, 422, 441, 456f., 
460, 462, 465, 471f., 476, 485 

ChatGPT 2, 13-17, 19, 21-23, 25, 30, 33, 34, 47- 
52, 54f., 58, 60, 61, 64, 66-69, 71-73, 76, 
78-80, 83, 86, 88f., 91f., 94-96, 98f., 101, 
115, 133-135, 138, 140-143, 147, 149, 166, 
169, 183-186, 192, 194f., 201f., 206, 211- 
216, 218, 223, 225f., 228, 230, 246, 249, 291, 
293, 296, 298, 301, 303f., 306-308, 311, 
314f., 321-323, 325f., 329, 331, 333, 335, 
342-344, 346, 350-352, 355, 358, 377, 390, 
408, 412, 419-421, 423, 429, 431, 440, 442, 
447-450, 452, 455-464, 467, 470-473, 475, 
481, 492, 496, 498, 500f., 503, 512, 514f., 
517, 521, 524-526, 528-533, 535 

ChatGPT 3.5 225, 442, 457, 495, 515 

ChatGPT 4 390f., 458 

Chat-Interface 54, 498 

Christologie 166 

Christus 162-165, 167, 266 

Christusereignis 163 

Citizenship 32 

Cleverbot 115 

Clip 413f. 

Cloud 451f. 

Code 18, 22, 52, 57, 67f., 75, 79, 138, 292, 352, 
449, 507 

Comicfiguren 126 

Community 141, 180, 303, 321, 454, 500 

Computer 1f., 40, 59, 86, 115, 127, 137, 184, 195, 
201, 206, 208f., 294, 408, 430, 440, 443, 
448, 492 

Computergenerierung 342 

Computerlinguistik 86 

Computerprogramm 2, 249 

Computerwissenschaft 86, 397 

Constitutional AI 295, 301 

Copyright 296, 341, 501, 503 

Copy Writing 90 

Corona-Pandemie 

Creaitor.ai 101 


286, 413 
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CTOs 448 

Curriculum 30, 38-40, 43, 91, 98 
Custom Prompting 501, 504 
Cut-ups 97 

Cyberangriff 347 
Cybersicherheitsrecht 348 
Cyborg 61, 255, 426 


DALL-E2 226, 291 

DALL-E3 409 

Darstellung 7, 57, 105, 108, 120-124, 128, 141, 
151, 161, 169, 191, 220, 249, 252, 259, 299, 
311, 315, 368, 381, 384, 488, 504, 509, 521 

Dasein 129, 260, 293, 376 

Data Mining 78, 126 

DaTa-Pin 522 

Dateiformat 117 

Datenabhängigkeit 70 

Datenanalysen 33, 52, 63, 126 

Datenansammlungen 242 

Daten 19, 22, 25, 49, 51, 60, 62-64, 68, 70-73, 
75, 85, 92, 126, 159, 208, 217, 219, 224, 
226f., 229-232, 254, 265-267, 269, 297f., 
313, 315, 335, 339, 345f., 348, 374, 376-378, 
405, 407, 425, 448, 449, 452-454, 458, 473, 
481f., 484f., 490, 493-495, 499, 503, 506, 
514-517, 519 

Datenbank 50, 250, 267, 336, 337, 339, 532 

Datenmaterial 249, 254, 426 

Datenmengen 16, 101, 207, 223, 265, 372, 482, 
493, 515 

Datenpräparation 74 

Datenquantität 60 

Datenquellen 293 

Datensatz 49-51, 62, 74f., 94, 121, 126-128, 
138, 225, 347 

Datenschutz 70, 298, 314f., 328, 331, 333, 
338f., 345, 348, 351, 479 

Datenschutzrichtlinie 71 

Datenschutzrisiken 52 

Datenverzerrungen 59, 66 

Davidsternen 286 

Debatte 7, 14, 16, 23, 39, 96, 113, 120, 150, 154, 
157, 165, 169-171, 175, 181, 186, 189, 194, 
197, 267, 283f., 286, 311, 313, 350, 363, 372, 
376, 378, 401, 419, 423, 429-431, 456, 481, 
483f., 487, 489, 493 


Decision Augmentation 471 


Deepfakes 21, 51, 341, 414 

DeepL 133, 305, 440, 521, 524, 532, 535 

Deep Learning 17, 87, 202, 292, 343, 409, 460, 
497, 499 

Definition 58f., 87f., 172, 203, 261, 288, 294, 
384, 388, 397, 440, 461, 489, 491-494, 509 

Dekodieren 117, 212 

Dekonstruktion 131 

Delegation 93, 129, 251, 312, 334, 436 

Dell 448, 450, 453 

Demokratie 24, 300, 347 


Demokratietheorie 330 

Demokratisierung 64, 268 

Demonstration 288 

Demonstrationsdaten 454 

Denken 1,3, 34, 39-41, 56, 59, 102, 105, 112, 
124, 130, 150, 169, 180, 185, 205, 210, 251, 
267-270, 294, 320, 330, 342, 375, 393, 398, 
466, 478, 486, 497, 502, 516, 519 

Denkfigur 30, 32, 35-38, 41f., 44, 46 

DeppGPT 268 

Deutscher Ethikrat (DER) 20-22, 30, 102, 299, 
270, 311f., 343, 410, 484f. 


Design 22, 29, 115, 255, 331, 365, 379, 404, 426, 
469 

Designentscheidungen 25 

Designs 121, 449 


Desinformation 6, 21, 51, 120, 130, 194, 338, 

352, 359, 401, 406-408, 412-414, 416f. 

Desinformationsbild 412 

Desinformationskampagnen 419 

Deutsche Forschungsgemeinschaft (DFG) 47, 
316f., 328, 461 

Deutsche Gesellschaft fur Hochschuldidaktik 
(dghd) 311, 317-319, 327f. 

Deutscher Journalisten-Verband (DJV) 409 

Deutungsversuche 288, 424 

Diagnose 20, 63, 72f., 482, 491, 493, 515 

Dialektik 120 

Dialog 52, 64, 91-93, 130, 205, 222f., 226, 229, 
298, 335 

Dialogsystem 343 

Dichotomie 111, 189f., 196 

Didaktik 38, 469 

Dienstleistungen 301, 333f., 337 

Diffamierung, Öffentliche 95 


Differenz, graduelle 8, 258f., 425, 433 

Diffusion 51, 226, 312, 405, 498 

Digital-Chefredakteurs 409 

Digital Humanities 207f., 461, 495, 512, 519 

Digitalisierung 40, 54, 59, 128, 206f., 252, 270, 

311, 372-374, 427, 496 

Digitalkameras 416 

Digitalkommunikation 359 

Digital Literacy Lab (DLL) 311, 317, 321f., 327 

Digitalunternehmen 417 

Diktat 159, 162, 167 

Diktum 246 

Dirty Talk 301 

Discord 532 

Discourse Lab 370 

Diskriminator 119 

Diskriminierung 51, 63, 94, 181, 194, 300, 305, 
313, 331, 333, 345 f., 482 

Diskriminierungsformen 94 

Diskurs(e) 1,2, 5, 8, 15, 21, 24, 29, 38, 42, 44, 
46, 61, 64f., 80, 84, 96, 98, 103, 109, 111, 
113, 115, 120, 125, 128, 134-136, 167, 181, 
184f., 187f., 190, 193, 197, 237, 239, 242, 245, 
247f., 251f., 263, , 265f., 271, 274, 307f., 310, 
327-331, 334f., 337, 339, 358, 363-368, 370, 
375, 378, 383-385, 387f., 390f., 394, 396f., 
403, 408, 420-423, 425-428, 431-433, 458, 
486-488, 491-493, 502, 506, 512-516, 518f. 

Diskursanalyse 24, 274, 366, 513f., 517-519 

Diskurslage 5, 238f. 

Diskurslinguistik 365, 367, 378 

Diskursmedium 116, 120 

Diskursschleife 515f., 518f. 

Diskursteilnehmer 390 

Diskurstheorie 497, 502, 506, 513, 519 

Diskurstypen 387 

Diskurszusammenhang 393 

Diskussion 1, 6f., 23, 30, 44, 46, 48, 65, 80, 
95f., 105, 149, 154, 165, 202, 208, 292, 295, 
310f., 317, 322, 327, 329, 334-336, 338, 358, 
378, 388, 393, 403, 414, 436, 457, 461, 483, 
485, 493f., 499 

Disruption 2, 13, 115f., 126, 194, 209, 220, 254, 
307f., 310, 342, 359, 372, 420, 474, 496, 518 

Distinktion 95 

Diversifizierung 454 

Diversität 347, 503 
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Divination 246 
dMGH 532 
DNP 532 
Domain 133, 300 
Dominator 62f., 65 
Doppelschöpfung 175 
Dramatik 57 
Drehbuchautor 288, 505 
Drehbuchtheorie 93 
Dreieck, didaktisches 
Drohnen 295 
Duktus 99, 187 
Dummheit 108 
Dwell Time 407 
Dynamik 7,30, 35, 63, 366, 379, 395, 421, 429, 
497 
Dystopie 


468-470 


92, 496, 515, 519 


Ebene 23f., 26, 42, 58, 117, 123, 141, 172, 209f., 
230, 233, 234, 240, 244f., 249, 262, 327, 335, 
345-348, 350, 352f., 367, 379, 385, 396, 401, 
421, 425, 427-429, 431-433, 459f., 462, 475, 
502f., 508f., 519 

Edition 174, 397, 436, 524, 528, 533 

Effekt(e) 20, 25, 27, 55, 84, 90, 98, 137, 225, 
232, 303, 407, 412, 458, 516 

Effektivität 40, 216, 237, 303, 315, 453, 479, 511 

Effizienz 21, 42, 51, 54, 89, 223, 372, 448f., 453 

Effizienzfaktors 453 

Effizienzsteigerung 55, 278, 303 

Ego-Dokument 284 

Eigenanteil 152, 158 

Eigendynamik 185, 188, 193, 196, 236 

Eigenständigkeit 294, 297, 302, 319f., 325, 466, 
506 

Eigentümlichkeit 

Eigen-Zitate 282 

Eindämmung 414 

Einflussmöglichkeiten 415 

Einflussnahme 84, 283, 436 

Einflussoperationen, automatisierte 414 

Eingabeaufforderung 524 

Eingabe(n) 17, 49f., 76f., 79, 117, 135, 154f., 223, 
292, 298, 315, 324, 326, 495, 500 

Eingabesequenz 49 


165f., 170 
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Einordnung 109, 202, 204, 211, 213f., 216, 220, 
226, 228-230, 307f., 311, 315, 322, 330f., 
334, 339f., 436, 509 

Einsatzmöglichkeiten 48, 65, 230, 321, 331f., 
335f., 340 

Einwilligung 70, 126 

Element 50, 91, 94, 104, 109, 111, 128, 166f., 
178, 206, 220, 223, 308, 320, 367, 378, 383- 
385, 437, 468, 476, 487f., 491 

ELIZA 2, 115 

Embeddings 219-223, 226, 228 

Emission 19, 348, 453 

Emoji 404 

Emotionalitat 

Emotion(en) 
461 

Emotionsgehalt 443 

Empathie 109, 348, 373, 436, 439-443, 478 

Empirie 51, 234, 254, 305, 364, 393, 395f., 436, 
469, 471, 519 

Empirische Theorie (ET) 
396 

Energieeffizienz 351 

Energiekosten 453 

Engagement 65, 257, 404f., 407, 442 

Entität 161, 166, 227, 485, 490 

Entscheidung 46, 62f., 68f., 71-73, 76-80, 102- 
104, 107, 111, 113, 129, 209, 276, 312, 314, 
323, 328 f., 332f., 336, 339, 350, 374, 379, 
392-394, 408, 417, 426, 441f., 459, 471, 
475-477, 479, 494, 514, 525 

Entscheidungsfähigkeit 129 

Entscheidungsfindung, automatisierte 
78f., 332, 403 

Entscheidungsmöglichkeiten 276 

Entscheidungsprozesse 76, 79, 392, 436f. 

Entscheidungssituation 392 

Entscheidungsträger 24, 479 

Entscheidungszeitpunkt 392 

Entstehung 61, 103-105, 109, 112, 131, 154, 170- 
172, 177f., 180, 206, 246, 253, 274, 304, 396 

Entstehungsart 247 

Entstehungskontext 25 

Entstehungsprozess 246 

Entwickler 73, 118, 128, 193, 208, 299, 342, 
344f., 350-353, 379, 415, 449, 485, 492, 
499, 503f., 507, 514 


338, 407 
103, 278, 403, 405, 407, 438-440, 


388-390, 392-394, 


72, 76, 


Entwicklung 1f., 7, 14-16, 20, 23, 27, 29f., 33, 
39, 42f., 47-50, 52, 59, 61, 65-67, 73, 76, 
79f., 84f., 91, 101-106, 110, 112, 115, 119, 
122, 127, 134, 147-149, 152f., 159-161, 169, 
184, 187, 193f., 202f., 208f., 212f., 226, 231, 
251, 308, 312f., 315, 317, 323, 328, 331, 
334f., 337, 342, 348f., 351, 353, 363, 372f., 
377, 379, 394, 397, 408, 416, 423, 435, 440, 
465, 467, 469, 472, 474f., 477f., 482, 489, 
493, 496, 506, 512, 514, 516, 519 

Entwicklungsziele 393 

Entwicklungszustand 387 

Entwirklichung 276, 286f. 

Entwurfspraktiken 131 

Entzifferung 125 

Enzyklopädie 30f., 93, 254, 397, 532 

Episoden 436 

Epistemizitat 364 

Epoche, nachmythische 

Erbe, literarisches 274 

Erbgut 280 

Erde 14, 16, 19, 35, 151, 190, 238, 240, 279, 319, 
344, 346, 348, 384, 393, 399, 431, 460, 510- 
512, 518, 522, 525, 530 

Ereignisketten 386 

Ereignissen 56f., 104, 406 

Erfahrung 25, 44, 97, 103-105, 111f., 120, 131, 
160, 163, 205, 232, 235, 265f., 270, 281, 330, 
458, 475, 486, 500, 528 

Erfahrungsrdume 44 

Erfahrungssphäre 56 

Erfahrungswelten 288 

Erfindungskraft 288 

Erfolg 26, 48, 74, 110, 112f., 134, 210, 279, 304, 
312, 365, 368, 370, 372, 374, 407, 416, 437, 
469, 511 

Erfolgsgarant 453 

Erforschung, systematische 
112, 274 

Ergebnis 49, 53, 59, 91, 118, 123-125, 135, 
139f., 154, 159, 171f., 175f., 179f., 194, 216, 
224f., 227, 229, 232, 246, 248, 250, 279, 300, 
302, 305, 320, 326, 329f., 334, 336, 339, 
414, 441f., 499f., 506, 514, 523f., 528 

Erkennbarkeit 275, 358 

Erkenntnis 6, 8, 16, 22, 44f., 54, 65, 76, 108, 
117f., 120, 125, 141, 159, 165, 221, 237, 239, 


3, 129, 150, 213, 464 


30, 33, 65, 69, 105, 


241, 248f., 251, 253, 260f., 276, 279, 376, 
411, 422-425, 431, 439, 441, 454, 456, 464, 
487f., 498f., 502, 507, 510, 512, 523, 525, 
528 

Erkenntnisgrund 151 

Erkenntnisproduktion 143 

Erkenntnistheorie 260 

Erklärbarkeit 67-69, 71-73, 76-80, 314, 489 

Erlaubnis 296, 318f., 346 

Erleben 42, 112, 246, 258, 260, 265, 270, 357, 
372, 421, 425, 427-433, 436, 442, 459, 463, 
498 

Erlebnis 95, 428, 432 

Erlernbarkeit 280, 283 

Erosion 68, 347 

Erscheinungen 235f., 242, 246 

Erscheinungsweise 236 

Erscheinungsweisen 236 

Erwartung 1, 14, 20, 35, 40f., 57, 97, 139, 279, 
284, 309, 344f., 389f., 441 

Erwartungshorizont 249f., 252, 288 

Erzählebene 459, 462 

Erzähltheorie 459, 462 

Erzählung 86, 93f., 104, 108, 110, 131, 176, 194, 
254, 455, 459, 462f., 497, 508 

Erzeugnis 326, 384 

Ethik 2, 8, 16, 48, 51, 61, 63, 65f., 69, 77, 79f., 
156, 163, 235, 239, 251f., 254, 265, 291-296, 
299, 305-310, 312f., 338, 343f., 373, 392, 
476f., 479, 483f., 486f., 489, 491, 493f., 
499, 503, 506f., 514, 517 

Europa 103, 133, 216, 298, 349, 351f., 453 

Europdisches Parlament 348 

Europäische Union 23, 195, 331, 336, 348f., 
351, 359, 453 

Evaluation 98, 293, 341, 367, 375, 458, 475, 517 

Evaluationstool 33 

Evaluationsverfahren 74, 79 

Evidenz, wissenschaftliche 24f. 

Evolution 23, 47, 54, 166, 481, 531 

Evolution, technologische 166 

Exegese 203, 269 

Existenz 125, 128f., 158, 172f., 227, 258f., 263, 
270, 284, 393, 422 

Experiment(e) 21f., 24f., 68, 70, 73-75, 94, 96, 
138, 147, 157f., 169, 211, 226, 286f., 391, 
441f., 521, 523f., 528, 
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Explanandum 236, 431 
Explanans 431 
Explosion 277, 412 


Facebook 196, 352, 402-405, 407f., 415, 497 

Face-to-Face-Kommunikation 435, 438 

Fachwissen 318, 475f., 528 

Facilitator 62f., 65 

Fähigkeit 17f., 49, 52, 61f., 75, 107, 124, 130, 
201f., 206, 212, 218, 223, 226, 228, 231, 243, 
264f., 270f., 278, 282, 302, 318, 348, 351, 
356, 375f., 380f., 391, 395, 420, 423, 439, 
441, 451, 465, 469, 471, 476, 478, 492, 496, 
499, 515, 517, 531 

Fahrlässigkeit 284 

Fake News 6, 8, 56, 60, 90, 264, 346, 351, 401- 
403, 405-407, 411-413, 461 

Fakten 6, 20, 57, 106, 212, 227, 336, 358, 406, 
420, 422f., 426, 430f., 433, 457, 512 

Faktenbasis 417 


Faktenlage 320, 422, 425, 429, 432f. 

Faktentreue 343, 406f. 

Faktenwissen 420 

Faktizitat 235, 407, 412, 499, 510, 515, 519 

Faktor 52, 57, 70, 72, 78, 98, 116, 126, 148, 377, 
385, 393, 401, 403, 406, 408, 509 

Faktum 426 

Fall-out 278 

Falschaussagen 419, 422, 425f., 460 

Falsches 262, 422, 424, 426 


Falschheit 51, 64, 210, 229, 244, 246, 262, 309, 
329f., 333, 344f., 386, 388, 419f., 426, 438, 
454, 462, 473, 526 

Falschinformationen 21, 50f., 299f. 

Fälschung 119, 121, 173, 300, 414, 511 

Feedback 17, 59, 119, 226, 293, 295, 343, 439- 
443, 469, 472-475, 478 

Fehler 25, 49, 51, 60, 97, 130, 215, 249, 252, 
284, 300, 305, 332, 337, 356, 374, 404, 410, 
441, 449, 462, 516 

Fehlinformationen 57, 59f., 64, 66, 351, 461 

Fehlinterpretation 230 

Fehlschluss, kategorialer 

Fiction Writing 92 

Fiktion 18, 103, 112, 142, 176, 178, 284f., 287, 
413, 422, 426, 441, 457 

Finetuning 452f. 


96, 427f. 


560 —  Sachregister 


Folgenabschätzung 341 

Forschung 2, 7, 16, 20, 22-24, 33, 35, 37f., 41, 
47f., 52, 57, 59, 62f., 65-71, 73-76, 80, 84, 
86, 92, 94, 98, 105, 134, 140, 143, 187, 207f., 
215, 241, 246, 252, 274, 308, 311, 314-316, 
322, 348, 384, 443, 449, 456, 465, 468f., 
471, 476, 481f., 506, 509, 531 

Fortschritt 7, 26, 59, 61, 67-69, 73, 80, 98, 111, 
128, 130, 134, 185, 188f., 193, 196, 210, 291, 
475, 478 

Fortsetzung 
392 

Frankfurter Rundschau 194, 410 

Freiheit 1, 103, 105, 112, 276 f., 288, 312, 379, 
493, 502, 517 

Freiraum 3, 123 

Fremdtexte 170 

Führungskommunikation 

Führungskontext 436 

Führungskräfte 435-440, 443, 448 

Funktion 22, 31, 36, 52, 99, 115, 130, 137, 148 f., 
158, 186, 261f., 265, 292, 308, 327, 363, 376, 
378, 407, 431, 447, 456, 465, 471f., 493, 509, 
516 

Funktionsäquivalenten 431 

Funktionsbereich 15 

Funktionsweise 21, 53, 58, 71, 84, 87, 116, 130f., 
180, 221, 224, 243, 263, 322, 342f., 345, 353, 
426, 479, 499, 506-508, 514, 519, 524 


16, 135, 138f., 142, 163, 211, 274, 


435f., 439f. 


GAN (s. Generative Adversial Network) 

Gatekeeper 403 

Gebot 60, 143, 149, 155f., 161, 165, 175, 309, 
317, 337, 397, 417, 466, 493 

Gedankenexperiment 102f., 112, 125, 149, 154, 
157f., 161f., 166, 170-172, 355-357 

Gedichte 85, 106, 293, 377, 455 

Gefahr(en) 5, 8, 53, 63, 183, 193, 236, 244, 265, 
277, 280, 303, 305, 313, 326, 331f., 336, 339, 
355, 358f., 363, 374f., 377-379, 420, 467. 
478f., 495, 497, 512, 517f., 530f. 

Gefährdung 52, 253, 465 

Gegentext 279 

Gegenwart 106, 129, 131, 152, 156, 165, 185, 
190, 194, 202, 204, 365, 390, 395, 502, 508. 

Gegenwartsliteratur, populäre 94 


Gehalt 5f., 157, 176, 179, 234-236, 238, 247, 
269, 286, 357f., 459f. 

Gehirn 87, 191, 243, 338, 376 

Geisteswissenschaften 188, 203, 208, 465, 502, 
522, 531 

Geltung 1, 6-8, 142, 148-150, 158f., 162, 165f., 
257, 266, 271, 273, 281, 283, 367, 376, 383, 
396, 422 

Geltungsanspruch 4, 143, 238-241, 248, 257 

Gemeinschaft 32, 37, 42, 45f., 71, 74f., 80, 108, 
158, 309, 442, 487 

Gemeinschaftsgefühl 443 

Genauigkeit 5, 20, 449, 473, 478 

Generative Adversarial Network (GAN) 117, 119 

Generative Pretrained Transformer (GPT) 5f., 
16, 34, 49f., 154-157, 159f., 183, 211, 220f., 
223, 226f., 229, 231, 263, 332, 343, 346, 415, 
447, 456, 498f., 507, 511f., 517, 524 

Generieren 1, 22, 31, 50-52, 54, 56, 59, 63, 67, 
71, 85-87, 95, 118f., 127, 135, 138, 140, 170f., 
178, 207, 222, 230, 254, 263, 265, 267, 298, 
324, 377, 389f., 409, 414, 423f., 427, 429, 
450, 462, 473, 479, 482, 484, 490, 511, 516, 
518 

Generierung 4, 50, 52, 141, 154, 160, 247, 336, 
347, 467f., 490 

Genre 17, 85, 213, 273, 275, 279f., 458 

Gerechtigkeit 329f., 493 

Gesamtsprachmodell 358 

Geschichte 57, 83, 86, 92f., 95, 103, 106, 115, 
122, 128, 150, 153, 161, 170f., 176, 189, 203, 
210, 212, 218, 262, 264, 277, 279-281, 283, 
286, 329, 397, 459f., 473, 493, 497, 508f., 
521-523, 528, 531, 533 

Geschichtsstudium 509f., 521-523 

Geschichtswissenschaft 2, 148, 187, 201-208, 
218, 228, 231, 322, 495-497, 505f., 508f., 
513, 518f., 521f., 527f., 530f. 

Gesetzbuch, bürgerliches 331, 333f. 

Gesetz 80, 234, 309f., 330, 332-336, 344, 348- 
352 

Gesinnung 298 

Gespräch 20, 223, 301, 319, 366, 368, 409, 413, 
419, 432, 462, 465, 472 

Gestaltung 7, 30, 33, 35-38, 40-44, 46, 78, 309, 
335f., 338, 403, 442, 474, 476, 478 

Gestaltungsdisziplin 295 


Gestaltungsfeld 29, 45 

Gestaltungsmittel 97 

Gestaltungsregeln 122 

Gestik 248, 438 

Glaubwürdigkeit 

Glitches 97 

Globalisierung 295 

Goal Augmentation 471 

Google 16, 80, 84f., 99, 184f., 192f., 210, 293, 

402f., 407-409, 415, 423, 498, 500, 507f., 

521, 524-526, 532, 535 

103, 105, 148, 150-153, 157, 162-167, 184, 

188f., 246, 263, 266, 380 

Gottesbeweis 249 

Gotteswort 159, 163, 167 

GPT (s. Generative Pretrained Transformer) 

GPT-2 74, 92 

GPT-3 29, 33f., 50, 67, 86, 92f., 133, 221, 223f., 
266, 343f., 346, 452, 454, 457, 524 

GPT-4 55, 59, 64, 93f., 192, 211, 225f., 230, 293, 
347, 350, 451, 458, 462, 498f., 524, 530 

GPT-Modell 49, 58, 185, 225, 247, 265, 267 

GPT-Technik 246 

GPUs 453 

Gradient Class Activation Mapping (Grad-CAM) 
76 

Grundrecht 336, 339, 348, 352 

Grundsituation 384 

Gültigkeit 129, 163, 281-283, 285, 483, 529 


68f., 73, 204, 239 


Gott 


Habgier 108 

Haftung 298f., 333, 351, 504 

Hagiographen 151-153, 165f. 

Hagiograph, menschlicher 159 

Hagiographomat 158f. 

Halbwahrheiten 299 

Halluzination 6, 50f., 56, 60, 171f., 174, 178f., 
258, 264-266, 271, 300, 343, 355, 459f., 
463, 499, 505, 512 

Handeln 5, 9, 34f., 42, 44, 46, 58, 138, 140, 143, 
174, 189, 195, 213, 216f., 240, 286, 294, 296, 
299, 301, 309, 312, 330, 333, 364-366, 385, 
393, 442, 459, 469, 471 

Handhabbarkeit 450 

Handlung 108, 204, 294, 309, 312, 346, 364f., 
367f., 370, 372, 377, 379, 442, 459f., 462f., 
482f. 
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Handlungsoption 16, 40 

Handlungsoptionen 16 

Handlungsprozesse 385 

Handlungsspielraum 442 

Handlungssubjekt 110 

Handwerk 125, 127, 130, 406, 531 

Hardware 384, 415f., 495 

Hardwareressourcen 16 

Heads 221-223 

Heatmap 76 

Herausforderung 2, 7, 13f., 20, 25f., 30, 33, 43, 
48, 52-54, 56, 60f., 65, 67-69, 71-73, 76, 
78-80, 102, 107, 141, 147, 153f., 207f., 231, 
248, 269f., 283, 299, 308, 311, 313-316, 
321f., 331, 333, 337, 348, 353, 373, 392, 395, 
398, 427, 435f., 452-454, 456, 466, 468, 
475, 477, 479, 482, 484, 495-497, 506, 508, 
510, 513, 528, 531 

Herkunft 143, 252, 283, 352, 356, 412 

Herkunftsnachweis 416 

Hermeneutik 8, 97, 148, 163, 201-210, 218, 220, 
228 f., 231f., 235, 246f., 257-259, 264-267, 
421, 457 

Heuristik 204 

Heuristiken 252, 254 

HiClub 411 

Hidden-Ebene 117 

Hiding 376 

Hierarchieebene 437 

Hieroglyphe 122, 261 

Himmel 151, 234, 379 

Hochschulbildung 29f., 32-35, 37, 323, 530 

Hochschuldidaktik 30f., 38, 317 

Hochschuldidaktische Arbeitsstelle (HDA) 317, 
321, 327f. 

Hochschuldiskurs 29, 34 

Hochschule(n) 13, 29f., 34f., 38, 187f., 301, 
303, 310f., 317, 319, 321-325, 356, 530 

Hochschulgesetz 325, 327 

Hochschulkontext 29, 33, 307, 323 

Homo sapiens 384, 387, 393, 399 

Hybrid, Human-AI 40, 47f., 61-63, 65f., 404, 


471 
Hyperparameter 73f. 
Hypothese 63, 103, 116, 281 
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Idee 58, 122f., 125, 160, 165, 172, 204, 229, 234, 

260, 276f., 287, 367f., 456, 459, 465, 472, 

477 

Ideen 20, 64, 95, 97, 103, 112, 140, 192, 205, 
273, 296, 316, 327, 334, 367f., 397, 430, 522 

Ideengenerierung 55, 60, 66 

Identifikation 33, 49, 118, 216, 260, 278, 318 

Identifizieren 22, 62, 76f., 118, 148, 174, 212, 
221, 236, 260, 285, 299, 449, 462, 477 

Identifizierung 16, 118, 216f., 277, 332, 345, 475, 
528 

Identitatsnachweis 332, 416 

Identität 3, 6, 153, 173, 216-218, 283, 332, 368 

Illusion 236 

Illustration 115f., 120-123, 190, 390f. 

Imitation 229, 346, 358, 409 

Imitationsmaschine 50 

Imitierbarkeit 275, 279, 281 

Immanenz 116, 128, 244, 331, 430 

Impfen 276, 286, 408 

Impfungen 403, 407f. 

Individualität 24, 33, 41, 44, 53, 83, 93, 97, 99, 
103-105, 108, 110-112, 122, 153, 170, 188, 
205, 231, 249, 254, 263, 274, 313, 320, 329, 
345f., 366, 397, 404, 416, 424, 468, 474, 
477f., 504, 509 

Industrie 80, 403, 447f. 

Industrieanwendungen 9, 447 

Infinite Monkey Theorem 172 

Inflation 448 

Influencer 410 

Infocalypse 56 

Info-Ökosystem 419 

Informatik 2, 106, 161, 295, 372, 379, 397, 461 

Information 20, 23, 51-53, 56f., 59-61, 64, 68, 
70, 74-76, 117, 135f., 139, 206f., 212, 215- 
217, 219, 224f., 227-231, 259, 262-264, 267, 
270, 287, 291, 294, 296, 315f., 320, 322, 332, 
339, 347, 349, 390f., 401, 405, 407, 419f., 
423, 425, 430-433, 438f., 454, 467, 469, 
471-473, 478 f., 500, 509, 512 

Informationsethik 292-302, 304 

Informationsgehalt 420, 423-425, 427-433 

Informationsgesellschaft 294f. 

Informationszeitalter 294 

Infrastruktur 20, 207, 449, 451-453 


Inhalt 18f., 21, 38f., 41, 43, 50, 57, 64, 66, 80, 
83, 117, 122, 126, 128, 130, 141, 152, 167, 171, 
206 f., 213, 215, 228, 231, 245f., 322, 325, 
330, 333, 337, 343, 345, 347, 349, 351-353, 
355, 401, 403-407, 409f., 413f., 416f., 424, 
436f., 439, 449, 464, 469f., 474, 484f., 
487f., 490f., 497-499, 503-505, 507f., 510, 
512, 514, 516, 529 

Inhalte-Feeds 403 

Inhaltsebene 414 

Inhaltsempfehlungen 403 

Inhaltsströme 402 

Inhaltsvermittlung 121 

Initiative 33f., 74, 91, 125, 310, 317, 321 

Innovation 13, 53, 59, 74, 126, 128, 342, 363, 
522 

Input 117, 119, 223, 243, 297, 387, 415, 426, 452, 
460, 515 

Input-Optimierung 464 

Instanz 130, 143, 150, 422f., 426, 428-430, 433, 
452, 496f., 500f., 504f., 516, 518 

Integration 7, 44, 47, 63, 75, 91, 126, 128, 130, 
302, 320, 384, 398, 455, 464f., 476-478, 
489, 503, 508 

Integrität/Integrity 
75, 126, 316, 465 

Intel 417 

Intelligenz (s. auch Künstliche Intelligenz) 1, 9, 
20f., 29f., 33f., 49, 56, 59, 67, 69, 76, 78, 
83f., 86, 91, 95f., 98 f., 101f., 106, 109f., 112, 
115f., 133, 137f., 143, 147, 149, 153-162, 166, 
179, 183f., 190-192, 195f., 202, 238f., 242f., 
246, 248, 254f., 270f., 275, 291f., 296, 299, 
308, 310f., 313, 321, 327, 331-334, 336-339, 
341f., 344, 349, 351, 359, 363, 369-373, 375, 
379, 383, 397f., 408, 410, 420f., 423, 426 f., 
431, 433, 447, 455f., 478, 484-486, 495, 
499, 504, 515, 522, 524, 527, 530f. 

Intelligenzleistungen 398 

Intentionalität 96, 233f., 240-242, 245, 247, 
249, 312, 420, 426, 433, 503f. 

Intention(en) 36, 96f., 104, 120f., 138, 166, 229, 
233, 238, 242, 245, 263, 365, 420, 426f. 

Interaktion 9, 37, 42, 50, 54, 63, 65, 72, 111, 
206f., 210, 213, 309, 364f., 368, 405, 407, 
437, 468-470, 472, 474, 477, 482, 485, 489, 
492, 505, 507 


13, 34, 48, 56, 58, 65, 73, 


Interaktionsrate 405 

Interesse(n) 7, 23f., 38, 61, 73, 101, 105, 107, 
150, 178, 184, 229, 246, 257, 274, 283, 295f., 
298, 305, 345, 347, 405, 437, 488, 492, 521 

Interface 93, 326, 500 

Internet 33, 52, 70, 83, 88, 106, 108, 120, 127, 
156, 160, 174, 267, 276, 296, 348, 350, 358f., 
402, 458, 460, 511, 521 

Internetdienste 294 

Internet-Tauschbörse 415 

Internutzer 403 

Interpretation 49f., 58, 62f., 68, 72, 121, 152, 
157, 183, 201-204, 207f., 214, 245, 259f., 
273, 278, 286f., 315, 457, 478, 509, 526, 528, 
530 

Intersubjektivität 3, 252f. 

Intersubjektivitätskriterium 252f. 

Intertexte 273, 278 

Intertextualitat 273-275, 282, 287, 366, 503 

Intertextualitätstheorie 502, 519 

Intertexualitat 280 

Intransparenz 250 

Introspektion 108 

Inverbation 163f., 167 

Investition 448, 452, 454, 493 

Ironie 281 

Irreführung 413, 511 

Irritation 57, 161f., 288 

Irrtumslosigkeit 152 

Isolierung 438, 507 

Isotyp 122 

IT 321, 448, 512 


Jasper 
Journalismus 
507 
JSTOR 532 
Jugendliche 


101, 501 
21, 57, 59, 90, 402, 409, 498, 505, 


189, 304, 356 f., 369 


Kaiserreich 
Kamera 126 
Kampagnenmotiven 413 

Kandidaten 215, 217f., 227, 413f. 

Kanon 14, 186 

Katastrophenliteratur 284f. 

Kategorien 30, 34, 62f., 190, 370, 414, 457, 473 
Kennzeichnungspflicht 126, 324, 337 


187, 190 
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Kenosis 167 

Kerndisziplinen 397 

Kern, empirische 34, 128f., 170, 358, 393-396, 
398 

Kerngedanken 388 

Kernkompetenz 530 

KI (s. auch Künstliche Intelligenz) 1f., 4-9, 13, 
20f., 26, 29f., 33-37, 39-46, 48, 53-56, 58f., 
62-67, 69, 71, 73-75, 80, 83-86, 88-93, 95- 
99, 101-103, 105-109, 112, 116f., 120, 125f., 
128-131, 135, 147, 160f., 169, 171f., 176, 178- 
181, 183-185, 190f., 194-196, 201, 233, 239, 
245, 249-251, 255, 258, 262-271, 274f., 277, 
280-282, 284-288, 291f., 294, 296f., 305, 
307f., 310f., 313, 317-321, 323-327, 329, 
331-339, 341, 343f., 347, 349-351, 353, 359, 
363-367, 370, 372-381, 383, 408-414, 416f., 
420-429, 431-433, 436, 440-443, 447f., 
451, 456f., 467f., 470 f., 474-476, 479, 483, 
485, 492-498, 501, 503-507, 509, 511f., 515, 
517f., 520, 522-524, 530-532 

KI, generative (s. auch Al, generative) 6-8, 48, 
54, 56, 64, 66, 125, 169, 180, 291f., 296, 
307f., 310, 313, 318, 327, 342, 347, 352, 
435f., 448, 450f. 

KI, kreative 103, 109, 112 

KI-Anwendung 20, 30, 33f., 37, 40f., 53, 58, 62, 
270, 308, 310, 313, 322, 335, 339, 447, 498, 
511 

KI-Assistenzsysteme 435 

KI-Autor:innenschaft 96 

KI-Bücher 88 

KI-Campus 34 

KI-Charaktere 411 

KI-Codierung 447 

KI-Content 88, 305 

KI-Empfehlungen 441 

KI-Entwicklung 38, 40, 43, 128, 193 

KI-Erzählprogramme 94 

KI-Ethik 105, 294, 299 

KI-Futurismus 125 

KI-Generatoren 116, 128, 180 

KI-Gott 184 

KI-Investitionen 447 

KI-Kollaborationen 98 

KI-Kontrollprogramme 252 

KI-Kreativität 112 
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KI-Lernprozesse 116 

KI-Literatur 84-88 

KI-Lyrik 85 

KI-Modell 5, 49f., 58-60, 71-73, 76-78, 154f., 
316, 350, 461, 496 

KI-Operatoren 233 

KI-Pakt 95 

KI-Produktionen 281 

KI-Publikationserfolge 85 

KI-Replikate 89 

KI-Schreibassistenten 53 

KI-Schreib-Software 89 

KI-Sprachmodell 48f., 64, 243-246, 249f., 252, 
254 

KI-System 3, 5, 16-18, 23, 25, 47, 49, 55f., 58- 
65, 69, 73, 76, 78, 111, 113, 268, 294, 299, 
302, 304f., 310, 312-315, 327, 331, 333, 345, 
349-351, 377, 408f., 414, 416, 435, 443, 472, 
478, 496 

KI-Szenarien 

KI-Technologie 
480 

KI-Text 5,9, 84, 88, 95, 97, 171f., 174, 176-180, 
239, 245-248, 258f., 263-265, 268, 271, 273, 
430, 512 

Kl-Textgenerator 1-5, 7f., 14f., 17-27, 53, 55, 
115, 171, 179, 181, 233, 236-239, 242-246, 
250-253, 307, 310-312, 315f., 318, 320-325, 
327f., 341-344, 353, 383, 419-433, 462, 
464-468, 470, 472, 476-479, 481-485, 487, 
491f. 

KI-Textverstandnis 97 

KI-Tools (s. auch KI-Werkzeuge) 2, 5, 34, 53f., 
169-172, 178, 180f., 258, 262-264, 268, 307, 
313f., 318-320, 322-327, 466, 518 

KI-Überprüfung 251 

KI-Unternehmen 127 

KI-Werkzeuge (s. auch KI-Tools) 
413f. 

KI-Zukunftsszenarien 29 

Kirche 121, 150, 152, 163f., 463, 523, 533 

Klagen 125, 296, 338 

Klassifikation 293, 513 

Klassifizierung 117, 393 

Klima 210, 237, 495 

Klimabilanz 239 

Klimapolitik 239 


30, 35f. 
15, 47f., 61, 312, 323, 350, 470- 


34, 39, 313, 


knowledge 25, 38, 55, 78, 111, 127, 171, 209, 
229, 390, 455, 469, 481 

Ko-Autorschaft 497, 503-505, 512, 519 

Ko-Kreativität 465 

Kognition 385, 387 

Kombination 50, 77f., 106, 135, 139, 223, 226f., 
274, 321, 344, 384, 404, 424-426 

Komik 275, 280f., 283, 285, 287f. 

Kommunikation 2, 8f., 22, 40, 44, 130, 133, 143, 
259, 303, 323, 331, 337, 353, 356, 378, 385, 
435-441, 443, 455, 464, 466, 470, 515 

Kommunikation, KI-gestützte 441, 443 

Kommunikation, KI-vermittelte 440, 443 

Kommunikation, menschliche 14, 69, 80 

Kommunikation, öffentliche 20-22, 312 

Kommunikation, symbolische 386 

Kommunikation, visuelle 122 

Kommunikation, wissenschaftliche 57 

Kommunikationsexperten 441 

Kommunikationsintentionen 96 

Kommunikationskanäle 439 

Kommunikationskompetenz 437 

Kommunikationsmitteln 449 

Kommunikationspartner 21, 437f. 

Kommunikationsprozessen 59 

Kommunikationsverhalten 19 

Kommunikationswissenschaft 2, 375, 405 

Kommunikationswissenschaftler 403 

Kompetenz 23, 39, 41, 44, 54, 156, 210f., 270, 
302-304, 313-315, 318f., 321, 348, 351, 357, 
374, 376, 381, 393, 443, 462, 464, 466, 
468f., 474f., 478, 485, 492, 513, 530 

Kompetenzanforderungen 39 

Kompetenzerleben 442 

Kompetenzprofil, neues 36 

Kompetenzverlust 270, 313 

Komplexität 2, 29, 37, 52, 59, 72, 105, 121, 268, 
282, 477 

Konfiguration 393 

Konflikt 46, 109, 187, 212, 327, 338 f., 406, 437, 
448, 459 

Konkurrenz 
306, 375 

Konkurrenzdruck 23, 346 

Konsens 26, 122, 330, 493 


34, 46, 58, 128, 187, 255, 288, 296, 


Konsequenzen 1, 37, 48, 57, 59, 73, 95, 109, 189, 
206f., 210, 251, 277, 284, 303, 312, 316, 321, 
342, 476 

Konstrukt 251, 276, 384, 450 

Konstruktion 19, 56, 58, 113, 130, 134, 136, 151, 
260, 364, 414f., 497, 509 

Kontext 8f., 18, 30, 33, 35f., 48-51, 53, 55f., 60, 
63, 65, 103, 113, 116, 120, 131, 135-137, 140, 
142, 172-175, 177f., 202, 204-208, 210, 212- 
217, 219, 221-223, 227, 229f., 232, 254, 259- 
261, 263f., 267-269, 284, 294, 299, 302, 314, 
328, 330, 333, 338 f., 364-366, 368f., 374, 
376, 381, 386, 388, 392f., 395-398, 408, 
435f., 438-440, 456, 458, 475, 479, 483, 
485, 491, 493, 510, 527-531 

Kontextualisierung 54, 141, 229f. 

Kontingenz 103-106, 109, 112, 180 

Kontrast 57, 121, 125, 135 

Kontrolle 5,8, 68-70, 79, 127, 180f., 251, 253, 
302, 313f., 326, 351, 356, 377, 415, 442f., 
472, 485, 489f. 

Kontrollmethode 251 

Kontrolloption 313 

Kontroverse 126 

Konventionen 58, 88, 120, 131, 336, 493 

Konversationsfahigkeit 16, 18 

Konzept 30, 49, 58, 60, 65, 77, 88, 98, 103, 111, 
113, 115, 127, 187, 202f., 205f., 210, 227, 
230f., 274f., 281, 299, 305, 364f., 367, 375f., 
392f., 395-397, 405, 416, 426, 447, 459f., 
462-464, 468f., 499 

Konzeption 26, 65, 92, 320, 342, 344 

Konzeptualisierungswerkzeug 91 

Kooperation 42, 55, 85, 93, 240, 287, 352 

Kopfnicken 438 

Kopie 171-179, 325f., 380 

Kopiermaschine 171, 176 

Kopierprozesses 175 

Körper 110, 118, 234, 358, 364, 483, 490, 492 

Körper-Geist-Dichotomie 110 

Körperhaltung 438 

Körperwahrnehmung 234 

Korpus 94, 138-140, 142, 210, 223, 274, 277, 
460, 508 

Korrelate 385 

Korrelation 128, 257, 269f., 518 

Korrespondenz 386, 389 
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Kreativität 6, 69, 80, 96, 98, 102f., 107-109, 
111-113, 130, 134, 143, 271, 331, 335, 355f. 

Kreativitätsbegriff 102 

Kreativitätsverständnis 96 

Krise 21, 57, 152f., 159, 162, 187, 437, 497, 513, 
519 

Kriterium 4, 120, 165, 253, 266, 313, 387, 391, 
501 

Kritik 3, 7, 58, 116, 120, 125, 127, 130, 143, 152, 
159-161, 164 f., 167, 194, 202, 204, 206, 246, 
263, 286, 487, 492, 500-502, 504, 506 

Kultur 32, 75, 101f., 116, 120, 130, 167, 183f., 
190, 262, 267, 301, 309, 323, 379, 422, 466, 
497, 499, 502, 505, 510 

Kulturkreis 299 

Kulturtechnik 304 

Kulturwandel 356 

Kulturwirtschaft 126 

Kunst 8, 91f., 97f., 121, 173-176, 186, 204, 259, 
278, 282 

Kunstformen 97, 173 

Kunstfreiheit 348 

Kunst, generierte 120 

Künstler 7, 91, 96f., 120, 125, 127, 296, 501 

Künstliche Intelligenz (KI) 1f., 4-9, 13, 20f., 26, 
29f., 33-37, 39-46, 48, 53-56, 58f., 62-67, 
69, 71, 73-75, 80, 83-86, 88-93, 95-99, 
101-103, 105-109, 112, 116f., 120, 125f., 
128-131, 135, 147, 160f., 169, 171f., 176, 178- 
181, 183-185, 190 f., 194-196, 201, 233, 239, 
245, 249-251, 255, 258, 262-271, 274f., 277, 
280-282, 284-288, 291f., 294, 296f., 305, 
307f., 310f., 313, 317-321, 323-327, 329, 
331-339, 341, 343f., 347, 349-351, 353, 359, 
363-367, 370, 372-381, 383, 408-414, 416f., 
420-429, 431-433, 436, 440-443, 447f., 
451, 456f., 467f., 470 f., 474-476, 479, 483, 
485, 492-498, 501, 503-507, 509, 511f., 515, 
517f., 520, 522-524, 530-532 

Künstliche Kreativität 113 

Künstliches neuronales Netzwerk (KNN) 
99 

Künstlichkeit 251 

Kunstmythos 128 

Kunstproduktionen 96 

Kunstwerk 8, 120, 125, 173 

Kybernetik 116, 130 
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Large Language Models (LLM) 3, 13, 15, 22f., 
49, 51, 58, 65, 83f., 133f., 186, 201f., 205f., 
209f., 218, 220, 228f., 231-233, 245, 247f., 
254, 342f., 346, 415, 424, 452, 454, 455f., 
461, 471f., 481, 484, 486, 495-497, 503-506, 
508, 511f., 514-518 

Latein 522 

Lateinabschreckungscharakter 522 

Lateinkenntnisse 521f., 524, 528f., 531 

Layer 117, 221 

Leak 415 

Learning-Analytics-Technik 474 

Lebensgeschichte 104, 106, 284 

Lebenspraxis 258, 262-264, 269, 429 

Lebensprozess, gesellschaftlicher 127 

Lebensrealität 105, 110 

Lebenswelt 2, 56, 97f., 241, 255, 258, 264-266, 
269f., 312, 426, 433 

Lebenszyklus 344, 353, 451 

Leerintentionen 253f. 

Lehrangebot 40-42 

Lehre 7, 29-38, 34, 36-38, 40-48, 103, 134, 
140, 143, 148-153, 157, 163f., 246, 308, 315, 
321f., 449, 456, 462, 464f., 470, 473, 475, 
522, 530f. 

Lehre, KI-gestützte 29f. 

Lehrinhalt 469, 474 

Lehr-Lernbedingung 40 

Lehrveranstaltungen 42, 249, 314, 318, 462 

Leiblichkeit 364 

Leistung 3, 14, 17, 79, 107, 175, 177, 186, 189, 
196, 224f., 296, 301f., 315, 319, 323, 325f., 
331, 357f., 420, 442, 451, 453, 456, 502, 516 

Leistungsfähigkeit 19, 64, 72, 77, 169, 358, 448, 
473, 495, 501 

Lektorat 89f., 495, 503 

Lektüre 95, 155, 169, 179, 263 

Lenker 524, 533 

Lernen 29f., 34, 41-44, 53f., 77, 117-119, 122, 
201, 261, 270, 273f., 277, 279, 281, 287, 292, 
321, 343, 355, 375f., 402, 422, 467, 470, 
472-474, 478-480, 510, 523, 530-532, 534 

Lernfähigkeit 387 

Lerngehalt 122f. 

Lernkurve 448 

Lern-Management-Systeme 34 

Lernpfad 472, 478 


Lernplattformen 40, 469 

Lernprozess 42, 118, 314, 468-470, 472, 475- 
478 

Lernsituation 469 

Lernstoff 281, 314 

Lernumgebung 33f., 42, 44, 470, 476 

Lesbarkeit 122 

Leseerwartung 95, 287 

Lesegewohnheit 279 

Leseinteresse 57 

Leseprogramm 281 

Leserschaft 277-280, 282, 284f. 

Leserschaft, gutwillige 284 

Liebesroman 275 

Like-Button 404 

Linguistik 9, 86, 134-136, 142f., 343, 347, 363, 
366f., 461 

LISA 90 

Literarizität 273 

Literaturbetrieb 84, 498, 505 

Literaturdidaktik 281 

Literatur 2, 83-87, 91-94, 96-99, 105 f., 108 f., 
111, 155, 170, 204, 237, 239, 273-280, 282, 
285, 287f., 291, 295, 330, 335, 401, 455, 
457 f., 467, 471, 473, 476, 483-485 

Literaturgeschichte 97, 287 

Literaturkritik 283 

Literaturmarkt 84, 88f. 

Literaturproduktion 84 

Literatursoziologie 280 

Literaturtheorie 84 

Literaturwissenschaft 84, 90, 94, 98, 274, 286, 
456 f., 461, 464-466 

Livedaten 300, 305 

Llama 408, 415, 498 

Local Interpretable Model-Agnostic Explanations 
(LIME) 77 

Logik 42, 59, 122, 130, 225, 237, 249, 269, 384, 
388 

LSF 523, 532 

Lüge 420-422, 424f., 428, 431-433 

Lyrik 83, 95, 106f. 


Machine Learning 72, 133, 140, 292, 295, 401, 
441, 461, 497-499 

Machtverhältnisse 129, 274, 486, 488 

Mainstream 277, 279, 283 


Mainstream-Literatur 279 

Mainstream-Texte 275, 280 

Management 24, 373, 375, 405, 437, 439f., 442 

Manipulation 51, 122, 294, 341, 347, 412, 419f., 
422, 432, 505, 507 

Marginalisierung 125, 484 

Marketing 90, 195, 303, 407, 449 

Markt 88f., 133, 183, 275, 277, 279, 308, 310, 
355, 358, 409, 448 

Marktförmigkeit 275, 277 

Marktmacht 306, 308 

Maschine(n) 1,4, 6f., 8, 20f., 26, 30, 36, 42, 44, 
48, 52, 84, 88, 91, 99, 101-103, 105f., 108- 
110, 112, 115, 127f., 131, 135, 141, 147, 156, 
165f., 202, 206, 210, 228, 231f., 266, 270f., 
275f., 281f., 287, 295, 298 f., 311f., 331, 333, 
334, 337-339, 372f., 379, 387, 401, 435, 474, 
484, 490, 505, 519, 531 

Maschinenethik 147, 251, 293-295, 300f., 305, 
490 

Maschinenhaftes 274 

Maschinenkunst 98 

Maschinenlernen 101 

Maschinenliteratur 88 
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Satz 72, 98, 136, 140, 173, 194, 213, 220, 227, 
265f., 335, 338, 450, 462, 524f., 528 

Satzzeichen 525 

Schachcomputer 337 

Schädigung 51, 280 

Schaffen 3, 16, 22, 74, 102, 124, 142f., 208, 267, 
271, 287, 315, 459, 468, 474, 476, 505, 513 

Schätzungen 441 

Schlüsselkonzept 219 

Schlüsselrolle 435 

Schlüsseltechnologie 363 

Schlussregel 378 

Schöpfer 151, 196, 323, 496 

Schöpfung 26, 95, 107, 155, 166, 192, 246, 
296 f., 323 

Schöpfungsakt 134, 191f. 

Schöpfungshöhe 6f., 95, 169f., 172f., 178f., 181 

Schöpfungs-Kraft 287 

Schöpfungsmythologie 155 

Schreibansätze 93 


Sachregister — 573 


Schreibassistenz 97 

Schreibbranche 126 

Schreiben 5, 13, 39f., 43, 52, 54, 67, 83f., 87- 
93, 95-99, 102, 106f., 126, 131, 134, 141f., 
154, 176, 224, 238, 249, 264-267, 270, 273- 
277, 281-285, 288, 304f., 318, 321, 323, 328, 
356, 364, 375, 420, 432, 440-443, 457, 496, 
501, 521f., 524, 531 

Schreiben, akademisches 
142f. 

Schreiben „dritten Grades“ 87 

Schreibfähigkeit 54, 258 

Schreibgehilfe 152f., 158, 166 

Schreibinstitute 92 

Schreibkompetenzen 88 

Schreibpraktiken 87,92 

Schreibpraxis 116 

Schreibprogramm 84, 89, 92f. 

Schreibprozesse 84, 91-93, 98, 180, 323, 496 

Schreibprozessforschung 91 

Schreibverfahren 85, 93, 98 

Schriftgebundenheit 161 

Schrift, Heilige 6, 126, 130, 147-158, 159, 161- 
167, 188, 203, 206, 246, 263f., 267, 270, 278, 
455 

Schriftlehre 150f. 

Schriftprinzip 147, 151-153, 159, 162 

Schriftsystem 122 

Schriftverkehr 498 

Schriftwerdung 167 

Schulaufgaben 442 

Schule 185, 267, 304, 319, 356, 469, 510 

Schutz 19, 125, 297f., 314, 347f., 452 

Schutzfähigkeit 172, 178f., 331 

Schutzsphäre 129 

Science-Fiction 83, 110, 275, 278f., 288 

Scientific Community 143 

Selbstbestimmungstheorie 

Selbsteinschätzung 390 

Selbsttäuschung 108 

Selbstverständnis 181, 307f., 310, 316, 406, 457 

Selbstwiderspruchsargument 174f. 

Selbstzweck 130, 270 

Self-Attention 49, 219, 221-223, 226-228 

self-fulfilling prophecy 250 

Semantik 8, 121, 135-138, 233, 265, 343, 366, 
502, 518 


48, 53-55, 134, 140, 


442f. 
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Semiotik 122, 385 

Serialitat 366 

Seriosität 302 

Server 67f., 70, 79 

Shapley Additive exPlanations (SHAP) 77 

Shoah 275, 283, 285 

Sicherheit 99, 159, 214, 314, 349, 358f., 449, 
485 

Signifikat 117 

Silbenfolge 250 

Silbenreihen 241 

Silicon Valley 112, 128, 192, 194, 497 

Simulation(en) 18, 135, 192f., 292, 312, 358, 
376, 403, 419, 421, 432 

Singular 185-189, 273, 526f., 534 

Singularität 58 

Sinn 1,9, 14f., 26, 30-32, 35, 37, 44, 46, 51, 60, 
97, 107, 130, 135f., 143, 147, 154f., 157f., 
162f., 165-167, 180f., 203, 209, 229, 231, 
235, 259, 261, 263, 266-269, 285, 288, 299, 
301f., 306, 310, 323 f., 330, 357f., 377, 381, 
385, 387, 394, 398, 426f., 455, 457, 462, 464, 
503f., 507, 509, 513f., 518 f., 528, 530 

Sinnfindung 129 

Sinnhaftigkeit 44, 129 

Sinnsimulatoren 358 

Sinnveränderungen 528 

Situation 35, 37, 41, 57, 246, 259, 265-267, 270, 
329, 363, 365, 386, 389f., 392, 394, 398, 
408, 420, 431, 437, 439, 455f., 478, 497f., 
506f., 518 

Skalierung 207, 449, 453 

Skandal 284, 286 

Skeptizismus 26f. 

Smart Glas 471 

Social Engineering 346 

Social-Media-Plattform 96, 401f., 407, 410f. 

Softwarecode 415 

Software 5, 22, 88, 116, 128, 323f., 326, 332, 
358, 384, 411, 451, 464, 495, 499f., 512, 531 

Softwareentwickler 415 

Softwarehersteller 326 

Softwareprodukten 347, 449 

sola scriptura 150, 203 

Sozialitat 364, 514 

Sozialphilosophie 483 

Sozialwissenschaft 69, 291, 322, 461 


Soziotechnik 341 

Spannungsverstärker 33 

Speech-to-Text 293 

Spezialisierung 32, 221, 454 

Spiegel-Skandal 287 

Spielberg-Projekt 285 

Spionage 347 

Sprachassistenten 295 

Sprachaufnahme 413 

Sprachbilder 184f., 187 

Sprachbot 183 

Sprachdienste 358 

Sprache 3, 5, 7-9, 17-19, 24, 51, 80, 94-96, 99, 
115, 125, 134-138, 142, 173, 178, 185f., 188, 
190f., 205f., 212f., 220, 223, 226, 229-232, 
235f., 242, 262f., 265, 268f., 299, 303-305, 
315, 330, 355, 358, 364, 369, 371, 376, 378, 
380, 385f., 388, 390, 397, 409, 412, 419, 450, 
455, 505f., 516f., 519, 522, 527f., 531, 533 

Sprache, natürliche 9, 86f., 210, 343, 499f. 

Sprachgenerator 69, 72, 317 

Sprachimperialismus 94 

Sprachkompetenz 22 

Sprachmedium 233 

Sprachmodell 1-3, 5, 7, 18, 29f., 33f., 39, 43, 
49-52, 60, 67-71, 73f., 75f., 78-80, 83f., 85, 
91f., 94, 134-136, 138, 194f., 220, 223f., 
226f., 229-231, 253, 263, 291, 293, 295f., 
298, 300, 305, 322, 332, 342-350, 352f., 
410, 415, 451, 456f., 458f., 460-462, 464- 
466, 493, 499, 514, 524 

Sprachstil 346, 358 

Sprachsystem 385 

Sprachtechnologie 2, 359 

Sprechen 43, 88, 116, 134f., 148f., 157f., 163, 
167, 173, 186, 210, 234f., 247, 274f., 281, 285, 
304, 306, 326, 352, 364, 366f., 370, 373, 
376, 381, 384, 431, 455f., 500, 509 

Sprechereignisse 135 

Sprecher-Instanz 420f. 

Stability AI 409 

Stable 139, 498 

Stable Diffusion 350, 409, 415, 498 

Stakeholder 15, 314, 353 

Stancedreieck 369 

Stancetaking 367-369 


Stancetaking-Aktivität 364, 367f. 


Standard 26, 46, 74, 180, 279, 314, 397, 406, 
410, 415-417, 453, 465, 504f., 508 

Standardisierung 267, 279, 285, 347 

Standardmodell 117 

Standard Operating Procedures (SOP) 482 

Start-up 416, 497, 499 

Status 47, 97, 172, 178, 183, 185, 187, 193, 234, 
254, 309, 450, 458, 486, 491, 501, 505 

Stellungnahme 20, 30, 47f., 102, 125, 249, 311- 
313, 316f., 327, 351, 484. 

Stereotype 93, 96, 299, 419, 431, 484 

Steuerpolitik 237, 239 

Stichwörter 300 

Stil 6, 18, 94, 107, 121-123, 141, 176, 293, 504 

Stilistik 6, 18, 94, 107, 121-123, 141, 176, 293, 
375, 504 

Stilreproduktion 121 

Stochastic parrots (s. auch Papagei, stochasti- 
scher) 6, 19, 50, 343, 456, 500, 515 

Strategie 19, 29, 31, 195, 239, 300, 303, 335, 
347, 366, 370, 372, 401, 468, 470, 474 

Struktur(en) 22, 68, 71f., 76, 89, 93f., 112, 129, 
131, 221, 240, 248f., 250, 257, 268, 275, 293, 
302, 321, 364, 384-386, 389, 392, 396, 460, 
487f., 518 

Struktur-Konzept 396 

Studie 13, 15, 25, 38, 51, 55, 66, 83f., 87, 94, 96, 
111, 140, 149, 177, 186, 239, 273, 279, 345f., 
378, 405-407, 436-439, 442f., 448, 455, 
458, 460f., 467, 471-475, 479, 521, 523, 527, 
531 

Subjekt 
517 

Subjektivitat 108-111, 113, 430, 513 

Subsystem 385 

Suchanfragen 402, 449 

Suche 6, 32, 46, 53, 55, 57, 92, 129, 204, 254, 
284, 375f., 406, 423, 447f., 463-465, 500, 
507 

Suchfunktionen 22 

Suchmaschine 50, 55f., 126, 185, 207, 293, 298, 
334f., 342, 345, 402, 407 

Suchmaske 53 

SULB 532 

Superintelligenz 110 

Super-Theorie 396 

Symbol 261 


106, 110f., 221, 252, 259, 267, 293, 509, 
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Symbolik 120, 122 

Synonym 33, 210, 219, 526 

Syntax 233, 265 

Synthes 258, 266f., 270, 450 

Synthesia 411 

System 5, 13, 17-24, 33f., A1f., 49, 58f., 61f., 
64f., 69, 78, 90, 92f., 128, 130, 135, 141, 153, 
206, 292-295, 297f., 312, 316, 333, 342-345, 
358, 375, 380, 384, 386f., 392f., 395, 397f., 
401f., 404f., 408f., 414, 430, 433, 442f., 447, 
452-454, 478f., 482, 485, 496, 501 

Systematik 164, 345, 414 

Systematisierung 295, 405 

Systemtheorie 26, 59 

System-Umgebung 52 

Szenario 21, 41, 58-60, 83, 106, 158, 165, 172, 
239, 253, 313, 320, 420f., 513 


Taschenrechner 304 

Tatsache 59, 64, 72, 116, 133, 136, 142, 157, 179, 
213f., 264, 274, 284, 287, 336, 408f., 416, 
420, 426-430, 432, 492, 509 

Tatsachenbehauptung 300 

Tatsächlichkeit 4f., 53, 64, 90, 112, 140, 142, 
156, 170f., 179, 181, 202, 211, 214f., 217f., 
223, 225, 227, 237, 260, 285, 326, 334f., 357, 
373, 401, 403f., 422, 424f., 427-432, 436, 
471, 506, 515 

Täuschung 247-249, 251, 260, 319, 346 f., 432 

Täuschungsabsicht 319, 413 

Technik 42, 76, 79, 90, 115, 128, 130, 133, 157, 
185-190, 196, 206, 270, 294, 304, 308, 312, 
332-335, 337, 339, 398, 410f., 438, 482, 
490, 497 

Technikdiskurs 8, 183, 185-187, 190, 196 

Technikethik 2, 294, 304 

Technikfolgen 14, 311, 359 

Technikfolgenabschätzung (TA) 
24f., 26f., 202, 331, 341f. 

Technikgeschichte 187 

Technikoptimisten 247 

Technikphilosophie 187, 208, 482 

Technikrecht 339 

Technikvertrauen 280 

Technologie 2, 7f., 14f., 22-24, 47, 51, 53, 61, 
64, 66f., 69, 78, 80, 88, 101, 111, 121, 130, 
133f., 147, 160, 183, 185-187, 190, 194, 196, 


2, 5, 13-16, 
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202, 206, 209, 218, 221, 228, 230, 232, 263, 
270, 294, 308, 313, 316, 341f., 355, 358f., 
363, 373, 381, 435, 448, 452, 467, 469-472, 
474-478, 490, 493, 496 

Technologie, digitale 2, 33, 206, 321, 355, 435, 
439, 469. 

Technologie, disruptive 

technology assessment 

Tetraeder 469f., 477 

Textanalyse 60, 209 

Text 1-9, 13, 15-18, 21f., 24-26, 30, 34f., 39, 
47-49, 52-54, 67, 69-72, 76, 79f., 83-85, 
87f., 90 f., 95-97, 106, 115f., 120, 122-124, 
126, 130f., 133, 135-143, 147-149, 153-155, 
157-159, 161-163, 165-167, 169-181, 187, 
193, 201, 203-223, 225-250, 252-254, 257- 
259, 261-271, 273-288, 291-293, 297-305, 
307, 310, 315f., 318, 302, 323-325, 327-329, 
334, 336, 338f., 341-344, 346f., 351, 358, 
364, 366, 370, 374, 377f., 383f., 386-391, 
394-396, 401, 408-410, 412, 414, 419-421, 
424-427, 429-433, 436, 443, 447, 449f., 
457f., 460-463, 466f., 473, 482, 490, 492, 
495-497, 499-512, 514-517, 519, 521-531 

Text, generierter 4, 50, 53, 135, 143, 153, 158, 
160f., 223, 237, 241, 243f., 246, 248-251, 
264f., 268, 324, 340, 342f., 352, 433, 466 

Text, KI-generierter 1, 25, 94-97, 111, 160 f., 173, 
180, 236, 257, 268, 335, 409f., 412, 466, 
510f., 516 

Text, KI-geschaffener 

Text, künstlich generierter 
252f. 

Text, menschlicher 95, 160, 258, 266 

Textbaustein 243, 280, 324, 326 

Textbezüge 273 

Text-Bild-Gefüge 366 

Textdatenbank 75 

Textduplikat 54 

Textebene 115 

Texteingabe 50, 117, 222, 508 

Texter 302f. 

Textergebnis 237, 241, 266 

Texterscheinen 244f., 247f. 

Texterscheinung 235 

Text-Erzeuger 386 

Texterzeugnisse 170f., 180f. 


120, 372, 454 
13, 341, 358 


522, 530f. 
39, 84, 157, 164, 250, 


Texterzeugung 169f., 180 

Texterzeugung, wissenschaftliche 

Textfeedbackprogramm 89f. 

Textform 15, 90, 99, 466 

Textfragment 56, 395 

Textgattung 278, 505, 516 

Textgehalt 247 

Textgeltung 6, 264, 271 

Textgenerator 15, 39, 80, 115f., 124, 131, 134, 
138, 140, 142f., 171, 180, 236-239, 243-245, 
247, 249, 252f., 257, 264-267, 270f., 291- 
293, 295-298, 300-306, 308, 310, 318f., 
321, 324, 333-335, 338, 342-347, 349, 353, 
384, 387, 390f., 394f., 419, 432, 476f. 

Textgenerator, KI-basierter 24, 133, 141f., 291f., 
295, 331, 337, 340 

Textgenerator, KI-gestützter 101f., 106, 111, 292 

Textgenerierung 6, 43, 53, 134, 142f., 223, 229, 
300, 307, 321, 335, 339, 353, 383, 387, 447 

Textgenese 95, 98, 274 

Text-Genre 275 

Textgrundlage 529 

Textheit 234 

Textidentität 169f., 173, 175, 177f. 

Textinhalt 238 

Textkohäsion 135 

Textkollektiv Ox0a 88 

Textkombination 50, 425 

Textkommunikation 140, 143 

Textkorpus/Textkorpora 70, 85, 87, 137f., 231f., 
282, 343 

Textmaschine 88 

Textmaterialien 24 

Text-Output-Effekt 94 

Textproduktion 55, 84, 89, 92, 116, 133-135, 
142, 169, 291, 307, 321, 325, 498, 500, 504, 
506f., 513, 519 

Textsinn 233 

Text-to-Speech 293 

Textualitat 135 

Textübersetzung 60 

Textverarbeitungs-Software 180 

Textverbesserung 60 

Textverständnis 4, 8, 97, 209, 242, 266, 506 

Textverstehen 208, 261f. 

Textwelt 282 

Textwerk 173 


Theorie 5, 30, 41, 58f., 98, 111, 115, 122f., 127, 
141-143, 173f., 177, 181, 192, 203, 208f., 232, 
240, 253, 273, 309, 331, 345, 364, 366, 384, 
388, 390, 393-396, 398, 435f., 483, 496, 
502, 508, 510 

TikTok 17, 402 

Token 49, 76, 139, 220, 223, 232, 237, 452, 454 

Tool 6, 8, 22, 24, 34, 53, 59, 66, 90f., 98f., 115, 
133, 169f., 172, 178, 180, 201, 208-210, 228, 
296, 305, 318-320, 324, 326, 416, 449, 455, 
471, 476, 481, 483, 485, 487, 489, 491, 493, 
500, 503, 507, 511, 521, 523-525, 528-530, 
532, 534f. 

Traditionszusammenhang 273 


Trager 162, 165 
Trainieren 117, 119, 121, 233, 249, 343, 347, 449, 
452f. 


Training 5, 16, 18f., 67, 70f., 94, 120, 134, 142, 
219-222, 225f., 231, 233f., 267, 299, 348, 
391, 415, 437, 452f., 499, 508, 514, 516 

Trainingsdaten 16, 19, 50f., 70f., 91, 93, 95, 111, 
135, 220, 223-231, 267, 324, 326, 347, 349, 
409, 416, 424-426, 431, 452, 456, 460-462, 
479, 484, 491, 514f., 518 

Trainingskorpus 91, 93f., 139, 228 

Trainingsmaterial 16, 19, 25, 265, 460, 517 

Trainingsphase 118f., 494 

Trainingsprozess 49, 71, 73-75, 79, 111, 344, 
346, 415 

Trainingssatz 118 

Trainingstext 458 

Transdisziplinarität 15, 90, 140, 384f., 396, 398 

Transformation 42, 60, 111, 122, 152, 251f., 308, 
379, 477, 493, 498 

Transformer 16, 22, 49, 202, 210f., 221-223, 
263, 343, 447, 450-452, 454, 499 

Transformer-Architektur 18, 49, 221, 498, 508 

Transformer-Modell 16, 138, 219, 222, 327 

Transhumanismus 110, 166 

Transkription 528 

Transparenz 19, 25, 52, 71, 73-75, 313f., 316, 
328, 333, 336f., 340, 349, 476, 479, 489, 530 

Transport 276 

Transzendenz 244 

Trial-and-Error-Prinzip 124 

Trigramme 137f. 

Trilogprozess 349 
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Triumph 130 

t-SNE-Visualisierung 76 
Turing-Maschine 115 

Twitter 268, 342f., 352, 405, 407, 411-413 
Typ H100 453 


Ubermittler 151, 162, 166 

Überprüfung 4, 6, 18, 39, 50, 54, 59, 63, 66, 
180, 214f., 227, 250-252, 265, 315, 340, 
426f., 465, 504, 510, 512, 519 

Uberpriifungskriterium 250 

Überprüfungsmethode 241, 248 

Überraschungshaltigkeit 288 

Überraschungsoffenheit 288 

Überraschungswert 406 

Übersetzung 18, 22, 34, 133, 210, 222f., 226, 
305, 315, 450, 481, 522-534 

Übersetzungstool 522f., 527, 532, 535 

Umgebung 40, 79, 111, 137, 384, 396, 451 

Umwelt 52, 131, 260, 295, 372, 395, 425, 482, 
490 

Unbegreiflichkeit 116 

Unberührtheit 288 

Ungenauigkeit 284, 315, 463 

Unglaubwürdigkeit 246, 424 

Ungleichheit 23, 314, 347, 483 

Universalismus 26 

Universum 399 

Unsicherheit 27, 49, 70, 104, 121, 161, 353, 419, 
452, 483, 528 

unsupervised learning 499 

Untergang 197 

Unterhaltung 233, 465 

Unternehmen 14, 20, 83, 90, 126, 128, 186, 
193-195, 213, 295f., 298, 300, 303, 308, 339, 
343, 346 f., 352, 357, 403, 411, 414, 416, 
448-450, 452, 454, 456, 500, 511 

Unternehmensethik 295, 302, 304 

Unternehmenswissen 452 

Unterstützung, maschinelle 134, 410 

Unterstützung, technische 26, 503 

Unterstützungssystemen 440 

Untersuchung 15f., 24-26, 48, 51, 104, 113, 140, 
148, 150, 202, 238, 242, 245, 259, 275, 277f., 
308, 365, 408, 447f., 471, 473, 483, 488, 
521-523 


Un-Wahrheit 300, 422-425 


578 —— Sachregister 


Urheber 125f., 154, 158, 247, 257f., 296, 338f., 
501, 519 
Urheberrecht 95f., 125f., 154, 170, 175, 178, 


264, 296, 324, 326, 348f. 
Urheberrechtsgesetz (UrhG) 
Urheberrechtsversto& 126 
Urheberschaft 1, 3-5, 64, 148, 162, 164, 253f., 

325, 358, 485, 506 
Urheberschutz 297 
USA 17, 84, 183, 187, 194, 298, 413, 511 
User Experience 449 
User Interface 449 


126, 323 


Valenz, emotionale 
Validitat 3, 64, 252 
Variationsfahigkeit 128 

Vektor 137, 219, 499 

Veränderung 2, 38, 63, 89, 274, 302f., 308, 341, 
346, 348, 379, 388f., 395, 398, 436f., 473, 
478, 496f., 502, 512f., 519 

Verdnderungserfassung 398 

Veränderungsgeschwindigkeit 

Veränderungsorientierung 437 

Veränderungsprozess 437 

Veränderungsregeln 388f., 394 

Veränderungszeit 398 

Veranstaltungen 521f. 

Verantwortung 22, 43, 46, 52, 63, 65f., 80, 122, 
129, 185f., 193, 196, 235, 254, 271, 295, 
298f., 312f., 320, 333, 336, 339, 359, 372, 
477, 485, 504f., 519 

Verarbeitung 17f., 24, 56, 72, 117, 126, 206f., 
209, 221, 226, 231, 242f., 275, 348, 384, 387, 
423, 460, 495, 498-500, 504 

Verarbeitungsmethode 242-244 

Verarbeitungsprozess 243, 460 

Verbesserung 20, 22, 74, 76, 78f., 302f., 337, 
352, 426f., 431, 471, 473f., 483 

Verbreitung 16, 21, 24f., 56f., 60, 128, 351, 401, 
407f., 414-416, 438, 441, 467, 470, 473 

Verdichtung 57f. 

Vereinfachung 94, 149, 189, 414, 507 

Vereinigung 14, 108f., 491 

Vereinnahmung, einseitige 14 

Vereinten Nationen (UN) 23, 393 

Verfahren 5,50, 59, 76f., 86, 92, 133, 137, 140, 
202, 204, 206, 210f., 224, 228-230, 237, 240, 


186, 405, 407 


129, 395 


243, 247, 250, 281, 313, 327, 332, 334, 351f., 
374, 376, 407, 416, 455, 465, 482, 488, 490, 
516 

Verfälschung 230 

Verfassen 3, 124, 136, 154, 156, 166, 237, 244, 
249, 263, 270, 315, 319, 323, 325f., 462, 473 

Verfasser*in 3, 154, 156, 162, 166, 246f., 269, 
510f. 

Verfasserintention, erkennbare 162 

Verfügung 2, 62, 74f., 84, 120, 126f., 149, 207, 
239, 291, 322, 333, 337f., 415, 452f., 475, 
512 

Vergangenheit 106, 108, 110, 193, 202, 204, 
330, 339, 395, 508f. 

Vergleichsdatensätze 454 

Vergleichskriterium 247 

Vergleichstext 250f. 

Verhaltensebene 439 

Verhaltenskodizes 406, 506 

Verhaltensleistung 397 

Verhaltensmuster 392 

Verhältnis 9, 26, 30, 32, 35, 118, 124f., 160, 
164 f., 173, 221, 262, 284, 304, 308, 381, 420, 
469, 505f., 509 

Verifikation 412 

Verlässlichkeit 5, 18, 50, 69, 71, 73, 80, 211, 217, 
229, 246, 417, 420f., 423, 425, 427-429, 
431f., 501, 512 

Verlauf 33, 94, 107, 152, 159, 223, 230, 284, 
288, 387, 465, 495, 497 

Verleger 154, 279 

Vermenschlichung 96 

Vermittlung 57, 60, 98, 120, 206, 243, 269, 468 

Vernetzung, intertextuelle 108, 273 

Vernichtung 276, 285 

Vernichtungsmaschinerie 285 

Vernichtungspolitik 284 

Vernunft 58, 103, 108, 115, 130, 143, 263, 312, 
465, 486f. 

Veröffentlichung 16f., 23, 29, 66, 75, 83, 88, 
126, 184, 195, 202, 301, 307, 321, 323, 325, 
410, 449, 456, 473, 481, 498, 530 

Verschleierung 112, 239 

Verschriftlichung 22 

Verschwörungsmythen 276 

Verstand 1,9, 41, 76, 122, 127, 140, 162, 167, 
204f., 213, 218, 233, 235, 243, 247, 253, 


259-262, 269f., 274, 282, 319, 324, 329, 351, 
355, 358, 368, 373, 384, 457, 486, 489 

Verständnis 1,4, 8, 15, 18, 26f., 44, 50, 53, 56, 
58, 62, 69, 71, 73, 76-79, 86, 96, 108, 116, 
123, 129, 134f., 150, 157, 163, 165, 170, 177, 
179, 186, 189, 196, 202-205, 207-211, 218f., 
222, 228f., 231-235, 243-247, 253, 257-259, 
261-264, 268-271, 275, 279, 288, 318, 330, 
344, 353, 366, 368, 375, 379, 384, 388, 391, 
394f., 398, 421-423, 435, 457, 459, 462, 466, 
470f., 475, 478f., 485f., 489, 492, 513, 522 

Verstehensobjekt 205, 231 

Vertrauen 25, 52, 56f., 61, 68f., 73, 78f., 239- 
241, 251f., 284, 339, 345, 439 

Vertrauensverlust 21 

Verwaltung 20, 312, 527 

Verwaltungsaufgaben 315 

Verwaltungsautomation 332 

Verweigerung 301, 365 

Verweildauer 405 

Verweis 22, 35, 103, 125, 140, 143, 154, 188, 227, 
261, 301, 335, 338f., 365, 393, 416, 517 

Verwendbarkeit 258, 535 

Verwendung 1, 7, 48, 55, 68, 70, 73f., 121, 185, 
207, 221f., 228, 277, 315, 324-327, 368, 
370f., 377, 451, 453, 457, 460, 462, 466, 473, 
479, 503, 506-508, 511, 518, 522f., 535 

Verzerrung 25, 63, 288, 299, 344, 515 
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